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APRESENTAÇÃO 


“A mente que se abre para novas ideias 
jamais volta ao seu tamanho original”. 
Albert Einstein 


Caro/a acadêmico(a)! 


A Estatística nasceu como ciência a serviço do Estado, fundada sob 
a lei dos Grandes Números e do Cálculo de Probabilidades. De acordo com 
Muller (2004), “[...] uma média, rigorosamente calculada, é muito mais 
confiável do que um censo “completo”, com contagens exaustivas e sem 
controle nos levantamentos”. 


Nesta perspectiva, apresentamos este Caderno de Estudos que tem, 
como propósito primeiro, o objetivo de esclarecer e minimizar as dificuldades 
existentes entre os diversos domínios do conhecimento e os múltiplos 
saberes. No âmbito da pesquisa científica tais lacunas tornam-se ainda mais 
acentuadas, haja vista que somos frutos de uma cultura patriarcal, sem dizer 
extremamente tradicional. A pesquisa requer o rompimento destas amarras, 
o corte do cordão umbilical da inércia a um mergulho nas profundezas dos 
saberes, almejando-se o ápice da sabedoria. 


Neste momento, queremos parabenizá-lo/a pela excelente decisão e 
escolha, de fazer parte de um time de vencedores, que fazem sua própria história. 


No intuito de facilitar a compreensão e, certamente, o manuseio 
deste Caderno de Estudos, seu conteúdo está dividido em três unidades que 
possibilitam a você compartilhar e desfrutar do uso das técnicas quantitativas 
para elaboração, descrição, compreensão, apresentação e interpretação de 
determinados problemas, mesmo que corriqueiros, da vida cotidiana. 


Na vida, estamos sempre rodeados de incertezas. São elas que movem 
a curiosidade e, consequentemente, engendram as veredas do saber. Assim 
também são os conceitos estatísticos que, além de possibilitar e facilitar a 
leitura e a compreensão da realidade, permitem estimar tais incertezas. 


Enfim, acreditamos que através deste Caderno de Estudos 
poderemos contribuir significativamente com o rompimento de muitas 
barreiras, o que lhe dará condições de adquirir conhecimentos úteis para a 
vida cotidiana e acadêmica. 


Então, mãos à obra! 
André Marcelo Santos de Souza 


Kiliano Gesser 
Márcia Vilma Depiné Dalpiaz 


Você já me conhece das outras disciplinas? Não? É calouro? Enfim, tanto 
para você que está chegando agora à UNIASSELVI quanto para você que já é veterano, há 
novidades em nosso material. 


Na Educação a Distância, o livro impresso, entregue a todos os acadêmicos desde 2005, é 
o material base da disciplina. A partir de 2017 nossos livros estão de visual novo, com um 
formato mais prático, que cabe na bolsa e facilita a leitura. 


O conteúdo continua na integra, mas a estrutura intema foi aperfeiçoada com nova 
diagramação no texto, aproveitando ao máximo o espaço da página, o que também contribui 
para diminuir a extração de árvores para produção de folhas de papel, por exemplo. 


Assim, a UNIASSELVI, preocupando-se com o impacto de nossas ações sobre o ambiente, 
apresenta também este livro no formato digital. Assim, você, acadêmico, tem a possibilidade 
de estudá-lo com versatilidade nas telas do celular, tablet ou computador. 


Eu mesmo, UNI, ganhei um novo layout, você me verá frequentemente e surgirei para 
apresentar dicas de vídeos e outras fontes de conhecimento que complementam o assunto 
em questão. 


Todos esses ajustes foram pensados a partir de relatos que recebemos nas pesquisas 
institucionais sobre os materiais impressos, para que você, nossa maior prioridade, possa 
continuar seus estudos com um material de qualidade. 


Aproveito o momento para convidá-lo para um bate-papo sobre o Exame Nacional de 
Desempenho de Estudantes — ENADE. 


Bons estudos! 


Olá acadêmico! Para melhorar a qualidade dos 
materiais ofertados a você e dinamizar ainda mais 
os seus estudos, a Uniasselvi disponibiliza materiais 
que possuem o código QR Code, que é um código 
que permite que você acesse um conteúdo interativo 
relacionado ao tema que você está estudando. Para 
utilizar essa ferramenta, acesse as lojas de aplicativos 
e baixe um leitor de QR Code. Depois, é só aproveitar 
mais essa facilidade para aprimorar seus estudos! 


Olá, acadêmico! 
Você já ouviu falar sobre o ENADE? 


Se ainda não ouviu falar nada sobre o ENADE, agora você receberá 
algumas informações sobre o tema 


Ouviu falar? Ótimo, este informativo reforçará o que você já sabe E 


e poderá ihe trazer novidades 


Vamos lá! 


Qual é o significado da expressão ENADE? 


EXAME NACIONAL DE DESEMPENHO DOS ESTUDANTES 


vv 


Em algum momento de sua vida acadêmica você precisará fazer a prova ENADE 


Que prova é essa? 


É obrigatória, organizada pelo INEP — Instituto Nacional de Estudos e 
Pesquisas Educacionais Anísio Teixeira. 


Quem determina que esta prova é obrigatória... O MEC = Ministério da Educação 


O objetivo do MEC com esta prova é o de avaliar seu desempenho vv 
acadêmico assim como a qualidade do seu curso, 


Fique atento! Quem não participa da prova fica impedido de se formar e não pode 
retirar o diploma de conclusão do curso até regularizar sua situação junto ao MEC 


Não se preocupe porque a partir de hoje nós estaremos auxiliando você nesta caminhada 


Você receberá outros mformativos como este, 
complementando as orientações e esclarecendo suas dúvidas. 


Você tem uma trilha de aprendizagem do ENADE, receberá e-mails, SMS, 
seu tutor e os profissionais do polo também estarão onentados. 


Participará de webconterências entre outras tantas atividades 
para que esteja preparado para mandar bem na prova ENADE. 


Nós aqui no NEAD e também a equipe no polo estamos 
com você para vencermos este desafio 


Conte sempre com a gente, para juntos mandarmos bem no ENADE! K f 


OF TTT: g 
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UNIDADE | 
CONCEITOS BÁSICOS DA ESTATÍSTICA 


OBJETIVOS DE APRENDIZAGEM 


A partir desta unidade você será capaz de: 


e dominar a terminologia, os símbolos usuais e conceitos básicos habitual- 
mente encontrados na literatura especializada de estatística, de forma a ler 
com proveito trabalhos técnicos; 

e reconhecer um trabalho de organização das informações necessárias à exe- 
cução de qualquer atividade, obedecendo às técnicas estatísticas; 

e realizar pesquisas, definir temáticas, delinear ações de coleta de dados, 
resumir, analisar, relatar, organizar e interpretar informações sobre o as- 
pecto estatístico; 

e efetuar cálculos pertinentes e necessários à obtenção dos chamados dados 
estatísticos; 

e delinear ações de coleta de dados, resumir, relatar, organizar e interpretar 
informações sob o aspecto estatístico; 

e desenvolver e demonstrar a capacidade de execução e interpretação de 
técnicas quanto à classificação dos vários tipos de variáveis e amostragens; 

e apontar quando a amostragem é preferível ao censo; 

e nomear e diferenciar os diversos métodos de amostragem, utilizando to- 
das as suas variações. 


PLANO DE ESTUDOS 


Esta unidade está dividida em 5 (cinco) tópicos. Ao final de cada um deles você 
encontrará atividades que contribuirão para a apropriação dos conteúdos. 


TÓPICO 1 - BREVE HISTÓRICO DA ESTATÍSTICA 
TÓPICO 2 - O MÉTODO ESTATÍSTICO 

TÓPICO 3 - ESCALAS 

TÓPICO 4 - AMOSTRAGEM 


TÓPICO 5 - SÉRIES ESTATÍSTICAS - APRESENTAÇÃO TABULAR 
E GRÁFICA 


UNDADE 1 | TÓPICO | 


BREVE HISTÓRICO DA ESTATÍSTICA 


| INTRODUÇÃO 


Neste tópico abordaremos aspectos gerais, porém importantes para 
o entendimento da Estatística, já que evoluímos a partir do conhecimento. 
Acreditamos que só é possível evoluir quando conhecemos como se deu e se 
dá o processo evolutivo dos conceitos, pois é a partir destas convicções que nos 
empenhamos e buscamos transgredir nosso status quo. 


2 SOBRE A ESTATÍSTICA 


Quando falamos em Estatística logo nos lembramos de apresentações 
numéricas em tabelas ou gráficos, como, por exemplo, resultados da observação 
dos mais variados fenômenos. Na verdade, é uma parte da Matemática Aplicada 
que trata de um conjunto de processos que tem por objetivo a observação, 
classificação e análise de fenômenos coletivos, bem como a introdução das leis 
a que tais fenômenos estejam subjacentes. Essas informações são coletadas com 
o propósito de resumir conhecimentos que são indispensáveis para o Estado, 
empresas e outras organizações, como indústrias, hospitais, seguradoras, bolsas 
de valores, para pesquisas agropecuária, biológica etc., que necessitam de 
estatística para controle e planejamento de suas atividades. 


Os métodos que a Estatística utiliza são aplicáveis a todas as ciências, 
inclusive nas atividades cotidianas. No entanto, alguns são mais utilizados em uma 
área do que em outra. Assim, por exemplo, os métodos de controle estatístico de 
qualidade são mais utilizados na indústria. Sua utilização vai desde o recebimento 
de matéria-prima, até a colocação de produto acabado no mercado consumidor. Os 
setores que necessitam do planejamento e da pesquisa, como é o caso agropecuário, 
são os que mais utilizam modelos estatísticos e análises de comparações para 
determinar espécies, tipo etc., no sentido de melhorar, aumentar e prever safras e 
produtos em geral, obtendo assim certa segurança em investimentos. 


De uma origem modesta, esta ciência cresceu e se desenvolveu nos últimos 
anos. Sua vasta utilização se deve principalmente ao surgimento de métodos 
computacionais eletrônicos. Foi com o surgimento e aperfeiçoamento dos 
computadores que os métodos estatísticos puderam ser devidamente utilizados. 
É possível dividir a estatística em três grandes áreas: estatística descritiva, 
probabilidade e inferência estatística. 


3 UM POUCO DE HISTÓRIA 


Quando começamos a relatar a história de algum conhecimento humano, 
sentimos a necessidade de informar a origem da ideia, todavia isso é impossível e 
um tanto desnecessário. Impossível porque precisamos relatar os fatos baseados em 
documentos, e não podemos ter certeza de que temos acesso a todos os documentos 
antigos, e um pouco desnecessário porque basta saber como se originou a ideia 
para termos uma boa noção da necessidade humana para criar tal conhecimento. 


Os primeiros documentos que falam sobre estatística datam de 5000 a.C., 
com os registros de presos egípcios. Depois existem documentos de 3000 a.C., com 
a contagem de falta de mão de obra para a construção de pirâmides. Na China, a 
estatística aparece documentada em 2238 a.C., quando o imperador ordenou um 
recenseamento para fins agrícolas e comerciais. Já em 600 a.C., os cidadãos do Egito 
tinham que, todos os anos, declarar sua profissão e sua fonte de rendimento. 


Um livro bastante conhecido no nosso país, a Bíblia, dá relatos de estatística 
quando conta a história do nascimento de Jesus. Por ordem do Senado, todos os 
indivíduos deveriam retornar ao seu local de nascimento para um recenseamento 
(recadastramento), e nessa viagem nasceu Jesus, e com ele toda a história do 
cristianismo. Se exagerarmos um pouco, podemos dizer então que, se não fosse a 
estatística, a história do cristianismo poderia ser diferente. 


Com esses documentos, vimos que a estatística nasceu com o objetivo de 
coletar, contar e organizar dados, sempre procurando pesquisar todos os indivíduos. 
Essa função começou a deixar de ser única quando, no ano de 1654, Blaise Pascal 
e Pierre de Fermat (entre outros) estabeleceram os princípios do cálculo das 
probabilidades. A probabilidade potencializou a abrangência da estatística porque, 
com ela, não seria mais necessário pesquisar todos os indivíduos, mas apenas uma 
parte da população (o que, hoje, é chamado de amostra). 


A palavra estatística foi usada pela primeira vez pelo alemão Gottfried 
Achenwall, em 1752, e deriva da palavra latina statu, que significa estado, numa 
alusão ao aproveitamento que os governantes estavam fazendo da estatística. 


4 ESTATÍSTICA NAS ORGANIZAÇÕES 


No mundo atual, a organização é uma das vigas mestras da economia dos 
povos. 


A direção de uma empresa, de qualquer tipo, incluindo as estatais e 
governamentais, exige de seu administrador a importante tarefa de tomar decisões, 
e o conhecimento e o uso da Estatística facilitam seu trabalho de organizar, dirigir 
e controlar a empresa. 


Por meio de sondagem, coleta de dados e recenseamento de opiniões, 
podemos conhecer a realidade geográfica e social, os recursos naturais, humanos 
e financeiros disponíveis, as expectativas da comunidade sobre a empresa, 
e estabelecer suas metas, seus objetivos com maior possibilidade de serem 
alcançados a curto, médio e longo prazo. 


A Estatística ajudará em tal trabalho, como também na seleção e 
organização da estratégia a ser adotada no empreendimento e, ainda, na escolha 
das técnicas de verificação e avaliação da quantidade e da qualidade do produto 
e, mesmo, dos possíveis lucros e/ou perdas. 


Tudo isso que se pensou, e planejou, precisa ficar registrado e documentado 
para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do 
material e, ainda, para um controle eficiente do trabalho. 


O planejamento nada mais é que o caminho a ser seguido durante a 
pesquisa, cujos resultados podem ser resumidos, com auxílio da Estatística, em 
tabelas e gráficos, facilitando a compreensão visual dos cálculos matemático- 
estatísticos que lhes deram origem. 


O homem de hoje, em suas múltiplas atividades, lança mão de processos 
e técnicas estatísticas, e só estudando-os evitaremos o erro das generalizações 
apressadas a respeito de tabelas e gráficos apresentados em jornais, revistas e 
televisão, frequentemente cometidos quando se conhece apenas superficialmente 
um pouco de Estatística. 


5 APLICANDO A ESTATÍSTICA À ADMINISTRAÇÃO E EM 
OUTRAS ÁREAS 


Eis alguns exemplos de aplicação da Estatística à administração e em 
outras áreas: 


e Uma firma que está se preparando para lançar um novo produto precisa conhe- 
cer as preferências dos consumidores no mercado de interesse. Para isso, pode 
fazer uma pesquisa de mercado entrevistando um número de residências esco- 
lhidas aleatoriamente. Poderá, então, usar os resultados para estimar as prefe- 
rências de toda a população. 


e As técnicas estatísticas são necessárias para separar efeitos de fatores diferentes. 
Por exemplo, é possível que o consumo de sorvete em uma comunidade de- 
penda do preço do produto, da renda média local, do número de crianças na 
comunidade e da temperatura média. Se dispuser de observações de todos os 
diferentes fatores em jogo, o leitor poderá aplicar a análise de regressão para 
determinar quais fatores têm os efeitos mais importantes. 


e Um auditor deve verificar os livros de uma firma para se certificar de que os 
lançamentos refletem efetivamente a situação financeira da companhia. Ele 
deve examinar pilhas de documentos originais, como notas de venda, ordens 
de compra e requisições, mas seria um trabalho incalculável consultar todos os 
documentos originais. Em vez disso, o auditor pode verificar uma amostra 
de documentos escolhidos aleatoriamente e, com base nessa amostra, fazer 
inferências sobre todos. 


Olá! Quando me apresentei a você, falei que estaria ao seu lado para esclarecer 


eventuais dúvidas... Muito bem, vamos lá! 
INFERÊNCIA, em estatística, significa estimarmos valores para todos os indivíduos, pesquisando 
apenas alguns. 


e Antes de lançar um novo remédio no mercado, é necessário fazer várias expe- 
riências para garantir que o produto seja seguro e eficaz. O melhor modo de 
testar um remédio consiste em tomar dois grupos tão semelhantes quanto 
possíveis, e dar o remédio a um grupo, mas não ao outro (placebo), e verificar 
então se os resultados nos dois grupos são diferentes. O grupo ao qual o 
remédio é dado é chamado grupo experimental e o outro é o grupo de controle. 
Torna-se necessária a análise estatística para determinar se todas as diferenças 
observadas realmente foram causadas pelo remédio ou poderiam ter sido 
causadas por outros fatores. 


e Se estamos recebendo um grande embarque de mercadorias de um fornecedor, 
teremos de nos certificar de que o produto realmente satisfaz os requisitos de 
qualidade acordados. Seria muito dispendioso fazer uma verificação de cada 
item; mas aqui, mais uma vez, as técnicas estatísticas vêm em nosso auxílio, 
permitindo-nos fazer inferências sobre a qualidade de todo o lote mediante 
inspeção de uma amostra de itens escolhidos aleatoriamente. 


6 DEFINIÇÃO DA ESTATÍSTICA 


A Estatística é uma parte da Matemática Aplicada que fornece métodos 
para coleta, organização, análise e interpretação de dados e para serem utilizados 
na tomada de decisões. (CRESPO, 2000). 


ESTATÍSTICA é um conjunto de métodos e processos quantitativos que 
serve para estudar e medir os fenômenos coletivos. (SILVA, 1999). 


Caro/a acadêmico/a!, lembre que para tirar o máximo proveito deste Caderno 


de Estudos você deve: 

* ler com atenção e executar todas as atividades; 

e utilizar as apresentações e/ou objetivos de cada capítulo para ter uma ideia geral do que 
cada um contém; 

* usar, sempre que possível, uma calculadora na resolução das atividades. 


RESUMO DO TÓPICO | 


Neste tópico você viu que: 


A Estatística lida com os mais diversose adversos fenômenose suas informações, 
associando os dados ao problema, descobrindo como e o que coletar e obtendo 
conclusões a partir das informações. 


As palavras estatística e estado têm a mesma origem latina: status. 


A Estatística é também comumente associada às pesquisas de opinião 
pública, aos vários índices governamentais, aos gráficos e às médias publicadas 
diariamente na imprensa. 


O crescente uso da Estatística vem ao encontro da necessidade de se realizar 
análises e avaliações objetivas, fundamentadas em conhecimentos científicos. 


O enfoque da Estatística é o de capacitar o/a acadêmico/a a utilizar métodos 
estatísticos de coleta e organização de informações como elementos para a geração 
de medidas estatísticas capazes de subsidiar o processo de tomada de decisão. 


AUTOATIVIDADE 


1 Identifique as diversas fases da Estatística no decorrer da história, localizando- 
as no tempo e reconhecendo (descrevendo) suas principais características. 


2 De acordo com o texto, qual é a importância da Estatística para a atual 
conjuntura social, política e econômica, principalmente na tomada de 


decisões? 


3 Qual é a importância da Estatística nas organizações? 


(o) 


UNIDADE 1 | TÓPICO 2 


O MÉTODO ESTATÍSTICO 


| INTRODUÇÃO 


Nas nossas atividades cotidianas, o método é sempre determinante, ou 
seja, se distribuíssemos três receitas de bolo para três confeiteiras, fornecendo- 
lhes todos os ingredientes da receita, inclusive com a mesma marca e exatamente 
o mesmo peso de cada um, certamente, pela lógica, deveriam sair três bolos 
iguais. Entretanto, sabe-se que isso não ocorre e os bolos todos diferem um do 
outro, inclusive no que tange ao sabor. 


Na estatística não é diferente, apesar de existirem as fases do método que 
apresentaremos a partir de agora. Ao fazer pesquisas, um mesmo método pode 
diferir, dependendo do pesquisador. Contudo, é importante conhecer pelo menos 
os principais, para que tenhamos ideias de como organizar uma pesquisa. 


Portanto, o objetivo deste tópico é que você, acadêmico/a, conheça as 
cinco fases do método estatístico e o aplique nas atividades desenvolvidas de 
agora em diante. 


2 MÉTODO 


E o conjunto de meios dispostos convenientemente para chegar a um fim 
desejado. Dos métodos científicos, vamos destacar o método experimental e o 
estatístico. 


2.1 METODO EXPERIMENTAL 


Conforme o próprio termo sugere, este método consiste em, através 
da experimentação, manter constantes todas as causas (fatores), menos uma, 
variando-a de modo que se possam descobrir seus efeitos, caso existam. Este 
método é amplamente usado nos diversos campos da atividade humana, bem 
como nas disciplinas de Física, Química, Biologia etc. 


Se você for gerente de uma empresa e permuta um funcionário do setor 
A com um do setor B e faz um acompanhamento do resultado, você está fazendo 
um método experimental. 


2.2 METODO ESTATÍSTICO 


Na impossibilidade de se fazer uso do método experimental, visto que nem 
sempre temos controle dos fatores envolvidos para fixar seus valores, usamos o 
método estatístico. O método estatístico considera todas as causas envolvidas no 
processo como variável e procura determinar, no resultado final, que influências 
cabem a cada uma delas. Como exemplo, pode-se citar a viabilidade, ou não, 
do lançamento de determinado produto, a partir de uma pesquisa de mercado. 
Pelo processo do método experimental, neste caso, poderia ser dispendioso e 
inadequado (basta imaginar a quantidade de fatores envolvidos nessa pesquisa, 
não temos como fixar todos eles). 


3 FASES DO MÉTODO ESTATÍSTICO 


São cinco as fases do método estatístico, a saber, na ordem que segue: 


3 COLETA DE DADOS 


Uma das primeiras coisas necessárias em estatística é observar como obter 
os dados depois de definido cuidadosamente o problema. Para isto existem duas 
maneiras: uma é usar dados já coletados por outra pessoa (dados secundários), 


outra é coletar os próprios dados (dados primários). Isto caracteriza a coleta 
indireta e direta, respectivamente. 


A coleta se diz indireta quando é inferida de elementos conhecidos e/ou 
do conhecimento de outros fenômenos relacionados com o fenômeno estudado. 
Ou seja, quando há disponibilidade de dados secundários adequados, economiza- 
se a coleta dispendiosa de dados primários. No entanto, quando se usam dados 
secundários, as definições, a finalidade, a cobertura, a frequência (quantas vezes), 
a temporalidade (atualidade), o nível de desagregação (os detalhes) e a exatidão, 
incluindo o tamanho da amostra e a tendenciosidade dos questionamentos feitos 
podem ser inadequados aos objetivos propostos. Dados secundários incluem: 
estatísticas oficiais, não oficiais e estatísticas obtidas dentro de empresas. 


A coleta é direta quando obtida diretamente da fonte. Ex.: empresa que 
realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. 


A coleta direta de dados pode ser classificada em relação ao fator tempo 
como: 


a) Contínua (registro) — quando é feita continuamente, tal como a de nascimentos, 
óbitos, os registros da fiscalização eletrônica de velocidade etc. 


b) Periódica — quando é feita em intervalos de tempo constantes, como os censos 
demográficos, matrículas semestrais e/ou anuais dos estudantes etc. 


c) Ocasional — quando feita ocasionalmente, a fim de atender a uma conjuntura ou a 
uma emergência, como no caso de epidemias, pesquisas eleitorais, avaliações etc. 


3.2 CRÍTICA DOS DADOS 


Obtidos os dados, eles devem ser cuidadosamente criticados, à procura 
de possíveis falhas e imperfeições, a fim de não incorrer em erros grosseiros, que 
possam influir sensivelmente nos resultados. A crítica dos dados pode ser de 
origem externa ou interna. 


e Crítica externa: quando visa às causas dos erros por parte do informante, por 
distração ou má interpretação das perguntas que lhe foram feitas. 


e Crítica interna: quando visa observar os elementos originais dos dados da 
coleta. 


Por exemplo, ao aplicar o questionário, temos que fazer uma crítica 
para verificar se as respostas obtidas condizem com a nossa necessidade (crítica 
interna). No caso de haver erros, precisamos saber o motivo da sua ocorrência 
para futura correção, verificamos se o pesquisado estava desatento ou se a questão 
foi mal formulada etc. (crítica externa). 


3.3 APURAÇÃO DOS DADOS 


Nada mais é do que a soma e o processamento dos dados obtidos e a 
sua disposição mediante critérios de classificação, ou seja, é o resumo dos dados 
através de sua contagem e agrupamento. E a condensação e tabulação dos dados. 


3.4 APRESENTAÇÃO DOS DADOS 


Não importa a finalidade que se tenha em vista, os dados são usualmente 
apresentados de duas formas que não se excluem mutuamente: a apresentação 
tabular, que é uma apresentação numérica dos dados em linhas e colunas 
distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho 
Nacional de Estatística, e a apresentação gráfica, que constitui uma apresentação 
geométrica, permitindo uma visão rápida e clara do fenômeno. 


3.5 ANÁLISE DOS RESULTADOS 


A última fase do trabalho estatístico é a mais importante e delicada. 
Está ligada essencialmente ao cálculo de medidas e coeficientes e sua finalidade 
principal é descrever o fenômeno (estatística descritiva). 


Na estatística indutiva ou inferencial a interpretação dos dados se 
fundamenta na teoria da probabilidade, que tem por base a indução ou inferência 
e abstrai, desses resultados, conclusões e previsões. 


RESUMO DO TÓPICO 2 


Neste tópico você viu que: 
O método pode ser experimental ou estatístico. 


O método estatístico é composto de cinco fases: a coleta, a crítica, a apuração, a 
apresentação e a análise dos dados. 


A coleta pode ser direta ou indireta. 

A coleta direta pode ser contínua, ocasional ou periódica. 

A crítica pode ser externa ou interna. 

A análise e a interpretação dos dados estatísticos tornam possível o diagnóstico 
de uma empresa (como, por exemplo, o de uma escola), o conhecimento de 


seus problemas (condições de funcionamento, produtividade), a formulação 
de soluções apropriadas e um planejamento objetivo de ação. 


AUTOATIVIDADE 


1 Complete: O método experimental é o mais usado por ciências como: 


2 As ciências humanas e sociais, para obterem os dados que buscam, lançam 
mão de que método? 


3 Cite as fases do método estatístico. 

4 Para você, o que é coletar dados? 

5 Para que serve a crítica dos dados? 

6 O que é apurar dados? 

7 Como podem ser apresentados ou expostos os dados? 


8 As conclusões e as inferências pertencem a que parte da estatística? 


l6 


TÓPICO 3 


ESCALAS 


| INTRODUÇÃO 


Todo fenômeno apresenta diversas variações que devem ser analisadas 
sob diversos aspectos, de modo que possamos compreendê-lo e agir sobre 
o mesmo. Assim, este tópico apresenta os tipos de variáveis com as quais nos 
deparamos ao estudar qualquer fenômeno e qual o melhor tratamento a ser dado 
a cada um. 


2 VARIÁVEIS 


Variável é o conjunto de resultados possíveis de um fenômeno, quando 
são feitas sucessivas medidas. São as características que podem ser observadas 
(ou medidas) em cada elemento da população. 


Por exemplo, um estudo sobre evasão escolar será realizado por um 
pesquisador, e o problema básico que se coloca nesta pesquisa é definir quais 
variáveis participarão do estudo. Nesse caso, podemos definir as variáveis como: 
idade, altura, cor dos cabelos, notas dos estudantes, renda familiar, sexo etc. (note 
a importância de definir bem as variáveis, pois é claro que “cor do cabelo” não 
tem importância para a nossa pesquisa em questão). 


Na maior parte das vezes, a escolha do método de análise ou descrição 
dos dados depende do tipo de variável (dados) considerada. Alguns conjuntos 
de dados (como alturas, pesos) consistem em números, enquanto outros são 
não numéricos (como sexo, cor do cabelo). Para distinguir esses dois tipos de 
dados aplicam-se, respectivamente, as expressões dados quantitativos e dados 
qualitativos. 


Vamos entender melhor estes dois conceitos. 


2.1 VARIÁVEL QUALITATIVA 


Os dados qualitativos (ou dados categóricos, ou atributos) são aqueles 
que resultam de uma classificação por tipos de variáveis, ou seja, quando seus 
valores são expressos por atributos como, por exemplo: sexo, cor da pele etc. 


Existem dois tipos de variáveis qualitativas: 


a) Nominal — Na variável qualitativa nominal, os valores são distribuídos em 
categorias nominais (atributos) sem qualquer ordem. Exemplo: sexo (masculino, 
feminino), raça, evolução (morte ou sobrevivência), cor dos olhos etc. 


b) Ordinal - Na variável qualitativa ordinal, os valores são distribuídos em 
categorias que têm uma ordem. Exemplo: escolaridade (analfabeto, Educação 
Infantil, Ensino Fundamental, Ensino Médio, universitário); classificação em 
um campeonato (1º lugar, 2º lugar, 3º lugar). 


2.2 VARIÁVEL QUANTITATIVA 


Os dados quantitativos são aqueles que resultam de uma contagem ou de 
uma mensuração. 


Quando suas características são identificadas por números, as variáveis 
quantitativas se dividem em: 


a) Contínua: as variáveis quantitativas contínuas resultam de uma mensuração 
e podem assumir qualquer valor (inteiro, fração etc.) como, por exemplo, 
estatura ou peso de um indivíduo. 

É uma variável que pode assumir, teoricamente, qualquer valor entre 
dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um 
termômetro de mercúrio, o que ocorre é o seguinte: o filete de mercúrio, ao dilatar- 
se, passará por todas as temperaturas intermediárias até chegar à temperatura 
atual do seu corpo. Outros exemplos de variáveis contínuas são: o tempo, a 
produção de alimentos, altura etc. 


b) Discreta: as variáveis quantitativas discretas são aquelas resultantes de 
contagens e constituem um conjunto enumerável de valores, como, por 
exemplo, o número de filhos (0, 1, 2, 3, ...), o número de alunos na turma (1, 2, 
3, ...) etc. 


Exemplo: o número de alunos em cada série de uma escola constitui- 
se de uma variável discreta porque representa uma contagem. Ou seja, é uma 
variável que só pode assumir valores pertencentes ao conjunto dos números 
naturais (resultado de uma contagem). Exemplos: produção de peças, faltas dos 
funcionários, livros de uma biblioteca etc. 


Uma população pode originar vários tipos de dados: 


QUADRO 1- COM PARAÇÕES ENTRE OS TIPOS DE VARIÁVEIS 
Variável Variável Variável Variável 
População quantitativa quantitativa qualitativa qualitativa 
contínua discreta nominal ordinal 
Idades, pesos, No Grau de 
Estudantes Nº de irmãos sexo . 
alturas escolaridade 
G de 
Automóveis Velocidade Nº de defeitos cores E 
luxuosidade 
Cara ou ualidade do 
Eletrodomésticos Valor em R$ Nº de ofertas Q 
barata produto 
FONTE: Os autores 


3 ESCALAS ESTATÍSTICAS 


Quando se faz um estudo estatístico, é necessário representar o fenômeno 
estudado através das chamadas escalas, que variam de acordo com o nível de 
medida das variáveis. 


As escalas são séries de unidades que representam o grau de variação 
da dimensão que está sendo medida. Ao medir o peso dos acadêmicos de uma 
turma, por exemplo, os resultados desta medida são representados por uma 
escala de razão, porque se trata de uma variável quantitativa contínua. Ou seja, 
geralmente, nesse caso, a escala utilizada será o quilograma, uma vez que não 
interessa sua fração; contudo, ao comprarmos carne, a escala será o grama. 
Em situações microscópicas temos que usar uma escala menor ainda. Ainda 
pensando em peso, ao negociar bois utiliza-se a escala arroba (15 quilogramas), 
para descrever o peso de um avião utiliza-se a tonelada. Esse mesmo raciocínio é 
utilizado nas outras variáveis, como distância, velocidade, tempo etc. 


O termo escala é utilizado em diversos campos do conhecimento e/ou atividades 


humanas. Segundo Ximenes (2000), escala é uma “[..] série de divisões traçadas sobre um 
instrumento de medição” Na Geografia, quando se tratar de plantas e mapas (cartografia), é 
a indicação usada, em forma de gráfico, das proporções adotadas para a sua elaboração. Nos 
meios de transporte, é o lugar de parada, entre o ponto de partida e o de chegada. Também 
pode representar uma tabela de serviços ou uma categoria, uma hierarquia. Na música, é a 
disposição sucessiva, por ordem de altura, das notas que compõem uma oitava. 


Existem quatro tipos de escalas de medida que dependem do nível de 
mensuração da variável em estudo e, em função disto, envolvem operações 
distintas: Escala Nominal, Escala Ordinal, Escala Intervalar e Escala de Razão. 


3.1 ESCALA NOMINAL 


São as escalas mais simples e comuns em pesquisas. As variáveis são 
divididas em categorias segundo um ou mais de seus atributos (características). 
São usadas em registros essencialmente qualitativos, como: sexo, tipo sanguíneo, 
partido político, credo religioso, estado civil e questões de dicotomia (sim ou não). 
Numa escala nominal é possível calcular moda e, ao invés de calcular médias, é 
possível efetuar cálculos proporcionais (porcentagens), como, por exemplo: 


TABELA 1 — CONFISSÃO RELIGIOSA DOS ACADÊMICOS DA INSTITUIÇÃO X — BLUMENAU - 
2004 


Confissão Religiosa Yo 


Católica 30 
Luterana 20 
Evangélica 12 
Espírita 10 
Adventista 15 
Outras 13 
Total 100 


FONTE: Secretaria da Instituição X — 2004 


Fique ligado/a: o símbolo f, representa a frequência (ocorrência) de cada religião. 
Utilizaremos sempre esse simbolo nas tabelas. 


Obs.: a porcentagem é calculada através da Regra de Três, ou seja, de modo 
simplificado, divide-se a parcela desejada pelo total e multiplica-se o resultado por 100. 


Exemplo 1 (porcentagem de católicos): 


[n° de católicos 


EN 


Católicos: =<-100 = 30% 


A 


| nºtotaldeentrevistados 


Exemplo 2 (porcentagem de luteranos): 


12 190 = 20% 
60 


Você pode notar que as outras porcentagens são feitas da mesma maneira: 
dividimos o total de cada religião pelo total de entrevistados (no caso 60) e multiplicamos por 
100 (porcentagem). 


3.2 ESCALA ORDINAL 


E a escala usada quando se quer avaliar um fenômeno em termos de onde ele 
se situa dentro de um conjunto de patamares ordenados. As escalas ordinais podem 
ser construídas usando-se: 


1 Numerais: pontos numa avaliação, gincana, concursos etc., como 0, 1, 2, 3, 
... onde “0” é o menor nível, “1” é o nível imediatamente acima, “2” o nível 
seguinte e assim por diante até se atingir um nível máximo arbitrariamente 
definido. 


2 Ranking: ordenações do tipo 1º, 2°, 3°, ... e/ou A, B, C, ... e/ou ouro, prata, 
bronze; onde o maior valor é o primeiro, o valor imediatamente abaixo é o 
segundo e assim por diante. 


Exemplos de grandezas medidas em escala ordinal: estado patológico, 
nível de instrução e status socioeconômico, conceitos etc. 


Numa escala ordinal é possível calcular todas as medidas de tendência 


central, igualdade e ordem (o significado dessas medidas e como efetuar os 
cálculos será assunto das próximas unidades). 


TABELA 2 — CLASSIFICAÇÃO NA XX FEIRA CATARINENSE DE MATEMÁTICA — POMERODE - 2004 


Projetos Classificação 
Erupção do vulcão Destaque 
Desmatamento em Blumenau Menção honrosa 
Juros reais pagos em um financiamento Participação 


FONTE: Secretaria Municipal de Educação - Pomerode 


3.3 ESCALA INTERVALAR 


É uma forma quantitativa de registrar um fenômeno, posicionando-o 
com relação a um valor conhecido, denominado como zero, e estabelecendo a 
diferença entre o valor do ponto zero e um segundo valor conhecido. São usadas 
quando se deseja comparar intervalos e medir o quanto uma preferência encontra- 
se distante de outra, segundo determinadas características e de acordo com a 
quantidade dessas características. 


Exemplo de escalas intervalares: notas dos alunos numa determinada 
disciplina, temperatura das cidades brasileiras, idades de um grupo de acadêmicos 
etc. Numa escala intervalar é possível calcular medidas de tendência central, posição, 
dispersão, correlações e inferências (com exceção da inferência, as demais medidas 
estudaremos nas próximas unidades). 


TABELA 3 - NOTAS DE ESTATÍSTICA DA TURMA A - CURITIBA/PR - 2004 


i Notas f, 
1 1+3 2 
2 3 -5 4 
3 5 -7 8 
4 7 }9 4 
5 9 F11 2 

Total 20 


FONTE: Secretaria da Escola X 


Olá!!! Neste momento é importante que você saiba que o simbolo - representa 
um intervalo fechado no início e aberto no final. Ou seja, o inatervalo 1 H3 quer dizer que nessa 
linha temos que contar todas as notas maiores ou iguais a 1 e menores que 3. IMPORTANTE: 
o 3 não entra nessa linha, pois o intervalo é aberto no final. 


3.4 ESCALA DE RAZÃO 


É a mais completa das escalas numéricas. Ela é uma quantificação 
produzida a partir da identificação de um ponto zero que é fixo e absoluto, 
representando, de fato, um ponto de nulidade. A escala de medida de razão 
quantifica os objetos, segundo determinadas características, podendo ordená-los 
para apreciar a igualdade das diferenças e, sobretudo, a igualdade de razões. 


São exemplos de medidas realizadas com escalas de razão: idade, peso, 
altura, pressão arterial, frequência cardíaca, renda etc. 


4 PROPORÇÕES E PORCENTAGENS 


A partir de agora, relembraremos dois conceitos muito utilizados na 
estatística: Proporções e Porcentagens. 


4.1 PROPORÇÕES 


As proporções, razões e porcentagens, sob o ponto de vista estatístico, 
podem ser consideradas medidas simples, porém importantes. Através delas 
podem ser estabelecidas comparações entre diversos grupos. 


Um número de alunos, por exemplo, pode ser classificado em três 
categorias. Essas categorias são, naturalmente, mutuamente exclusivas (um 


elemento da pesquisa não pode ter duas religiões ao mesmo tempo) e exaustivas 
(todos os indivíduos se “encaixam” em uma, e apenas uma, categoria). 


Considere a tabela a seguir: 


TABELA 4 — RELIGIÃO DOS ALUNOS DAS ESCOLAS M E R DE SÃO PAULO - 2002 


Religião Escola M Escola R 
Católicos 122 13 
Protestantes | 104 | 25 
Adventistas | 71 | 5 
Outra 203 27. 
Total 500 70 


FONTE: Secretaria da Escola M e R - 2002 


Não é tão simples, em termos absolutos, dizer qual das duas escolas é 
mais católica, por exemplo, pois o total de alunos é muito diferente entre elas. A 
comparação pode ser estabelecida mais rapidamente se os dados forem expressos 
em proporções. 


A proporção de alunos pertencentes a uma categoria (tipo de religião) 
é determinada mediante o cálculo do quociente entre o número de alunos 
pertencentes àquela categoria (religião) e o número total de indivíduos 
considerados (total dos alunos de cada escola isoladamente — 500 e 70). 


TABELA 5 — RELIGIÃO DOS ALUNOS DAS ESCOLAS M E R DE SÃO PAULO - 2002 


Escola M Escola R 
Religião 
f P f P 
Católicos 122 0,24 13 0,19 
Protestantes 104 0,21 25 | 0,36 
Adventistas 71 0,14 5 | 0,07 
Outra 203 041 27 0,38 
Total 500 1,00 70 1,00 


FONTE: Secretaria da Escola Me R - 2002 


Note que o 0,24 que aparece na linha dos católicos da Escola M vem da 
divisão a, que é o número de católicos daquela escola dividido pelo número 
5 


total de alunos ou, em outras palavras, é a razão entre o número de católicos e o 
total de alunos. Os demais valores das duas colunas “proporção” são achados de 
maneira análoga. 


Com as razões calculadas, é fácil comparar o fenômeno em estudo e dizer 
que na escola M, proporcionalmente, há mais católicos que na escola R. Pode- 
se também visualizar que na escola R há mais protestantes do que na escola M, 
proporcionalmente falando. 


4.2 PORCENTAGENS 


As porcentagens são calculadas a partir das proporções, multiplicando- 
se o quociente por 100. A porcentagem determina o número de indivíduos de 
uma determinada categoria imaginando que o total é sempre 100, ou seja, tantos 
indivíduos por 100. Assim como a soma das proporções é 1 (um) a soma das 
porcentagens é 100 (cem). 


As porcentagens são mais usadas que as proporções para produzir 
resultados. 


TABELA 6 - RELIGIÃO DOS ALUNOS DAS ESCOLAS M E R DE SÃO PAULO - 2002 
Escola M Escola R 
Religião 

f, P Yo f, P Yo 
Católicos 122 0,24 24 13 0,19 19 
Protestantes 104 0,21 21 | 25 0,36 36 
Adventistas 71 0,14 14 | 5 0,06 6 
Outra 203 0,41 41 27 0,39 39 
Total 500 1,00 100 70 1,00 100 


FONTE: Secretaria da Escola Me R - 2002 


Viu? Para determinar a porcentagem, multiplicamos a proporção por 100. Por 
exemplo, na linha dos católicos da Escola M, 0,24 representa 24%, que nada mais é que 0,24 
multiplicado por 100. 


4.2.1 Uso das proporções e porcentagens 


As proporções e porcentagens têm como objetivo fundamental estabelecer 
comparações relativas à unidade um (1) ou relativas à centena (100). Desta forma, 
quando o número base (total de elementos) for muito pequeno, é preferível usar o 
número efetivo (a frequência real - f) e não o número percentual ou proporcional. 
Entende-se por muito pequeno um total inferior a 50. 


Por outro lado, mesmo quando o número base é grande (acima de 50), é 
conveniente indicar sempre o número de casos (f) juntamente com as porcentagens 
ou proporções. 


5 ARREDONDAMENTO DE NÚMEROS 


Algumas operações matemáticas resultam em números não inteiros, com 
várias casas decimais, ou seja, com vários dígitos após a vírgula. Quando um 
número desse tipo apresentar uma quantidade de casas decimais maior que a 
desejada, precisa ser arredondado baseado em regras específicas. 


Para realizar o arredondamento, precisamos saber se o arredondamento 
desejado é por inteiro, decimal, centésimo, milésimo etc. 


milésimo: 


5.1 REGRAS DE ARREDONDAMENTO 


A partir de agora mostraremos várias situações envolvendo 
arredondamento. O arredondamento é algo muito simples para quem entende 
bem a formação dos números decimais, e acreditamos que você não terá 
dificuldades. 


Exemplo 1: arredonde, para duas casas decimais, o número 3,4328976. 


Veja: 


Dígito 
3,41328976 


— > Digitos 


O dígito remanescente indica a posição do decimal que ficará no número 
e os dígitos posteriores serão arredondados (serão zeros). Todos esses dígitos 
formam a parte decimal a ser considerada. Para todo arredondamento temos 
duas opções, uma “para cima” e outra “para baixo”, em relação à parte decimal a 
ser considerada. Nesse caso específico teríamos: 


3,4400000] (arredondamento para cima) 


3,4328976 
3,4300000| (arredondamento para baixo) 


Duas coisas a observar: só uma das opções acima é a correta, e os zeros à 
direita de um número decimal não precisam ser escritos. 


Para determinar qual é o arredondamento correto, observamos a parte 
decimal a partir do dígito remanescente (parte decimal a ser considerada). 
Voltemos ao caso acima: 


A parte decimal a ser considerada: 328976 está mais perto de 300000 
(arredondamento para baixo) ou 400000 (arredondamento para cima)? É evidente 
que 328976 está mais perto de 300000! Logo, o arredondamento é para baixo, e o 
número arredondado é 3,43. 


Veja que escrevemos 3,43 porque os “zeros” posteriores não precisam ser 


escritos. 


Nos próximos exemplos faremos esta análise mais rapidamente, mas a 
ideia é sempre a mesma. Quando houver dúvidas, olhe esse primeiro exemplo e 
faça as conexões. 


Exemplo 2: arredonde o número 4,542457 para 3 casas decimais. 


Dígito remanescente e dígitos posteriores 
4,542457 


Dígito remanescente: 2 Dígitos posteriores: 457 


Parte decimal a ser considerada: 2457 


Opções de arredondamento: 4,542000 ou 4,543000 


Análise do arredondamento: 2457 está mais perto de 2000 ou de 3000? 


Como está mais perto de 2000, o número será arredondado para baixo e 
ficará: 4,542. 


Exemplo 3: arredonde o número 7,35120987 para 2 casas decimais. 
Dígito remanescente: 5 Dígitos posteriores: 120987 
Parte decimal a ser considerada: 5120987 


Opções de arredondamento: 7,35000000 ou 7,36000000 


Análise do arredondamento: 5120987 está mais próximo de 5000000 ou de 
6000000? 


Como está mais perto de 5000000, o arredondamento ficará: 7,35. 
Exemplo 4: arredonde para uma casa decimal o número: 4,56123. 

Dígito remanescente: 5 Dígitos posteriores: 6123 

Parte decimal a ser considerada: 56123 

Opções de arredondamento: 4,50000 ou 4,60000 

Análise do arredondamento: 56123 está mais próximo de 50000 ou de 60000? 


Como 56123 está mais próximo de 60000, arredondamos para cima e o 
número ficará: 4,6. 


i o 
= 


Aposto que você está com uma pequena dúvida... Observe que nenhum dos 
exemplos anteriores está exatamente no meio das opções acima e abaixo. O que fazer nessa 


situação? Ou seja, o que fazer quando a parte decimal a ser considerada está na mesma 
distância da opção “acima” e da opção “abaixo”? Para responder a essa pergunta, veja o 
exemplo a seguir: 


Exemplo 5: arredonde para 3 casas decimais o número 874,3245. 

Dígito remanescente: 4 Dígitos posteriores: 5 

Parte decimal a ser considerada: 45 

Opções de arredondamento: 874,3240 ou 874,3250 

Análise do arredondamento: 45 está mais próximo de 40 ou de 50? 

Como 45 está na mesma distância de 40 e de 50, arredondamos para o 
número que terá o último dígito par, não importando se é para cima ou para baixo. 
(Note que essa regra é apenas aplicável quando o número está EXATAMENTE 


NO MEIO das duas opções.) Nesse caso ficará 874,324, já que 4 é par. 


Exemplo 6: arredonde para 2 casas decimais o número 1065,875. 


Dígito remanescente: 7 Dígitos posteriores: 5 

Parte decimal a ser considerada: 75 

Opções de arredondamento: 1065,87 ou 1065,88 

Análise do arredondamento: 75 está mais próximo de 70 ou de 80? 

Novamente, temos o número exatamente na mesma distância das duas 
opções. Então, arredondaremos de forma a deixar o final do número par, nesse 
caso, para cima e o número arredondado será: 1065,88. 

Veremos agora exemplos de arredondamento para o inteiro mais próximo. 

Exemplo 7: arredonde para inteiro (0 casas decimais) o número 297,865. 

Dígito remanescente: 7 Dígitos posteriores: 865 

Parte decimal a ser considerada: 7865 

Opções de arredondamento: 298 ou 297 


Análise do arredondamento: 7865 está mais próximo de 8000 ou de 7000? 


Como 7865 está mais próximo de 8000, arredondamos “para cima”, e o 
número arredondado fica 298. 


Exemplo 8: arredonde para inteiro o número 1013,5. 

Dígito remanescente: 3 Dígitos posteriores: 5 

Parte decimal a ser considerada: 35 

Opções de arredondamento: 1014 ou 1013 

Análise do arredondamento: 35 está mais próximo de 40 ou de 30? 

Como 35 está EXATAMENTE NO MEIO de 40 e de 30, arredondamos de 


modo a deixar o último dígito par, ou seja, nesse caso o número arredondado será 
1014, pois 4 é par. 


RESUMO DO TÓPICO 3 


Neste tópico você viu que: 
A variável pode ser qualitativa ou quantitativa. 
A variável qualitativa pode ser nominal ou ordinal. 
A variável quantitativa pode ser discreta ou contínua. 
Uma escala pode ser: nominal, ordinal, intervalar ou de razão. 


Proporções e porcentagens são importantes medidas estatísticas na comparação 
entre diversos grupos. 


O arredondamento é a aproximação para o decimal mais perto com a quantidade 
de casas decimais desejada. 
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AUTOATIVIDADE 


1 Existem os seguintes tipos de variáveis estatísticas: 


a) Variável quantitativa discreta. 
b) Variável quantitativa contínua. 
c) Variável qualitativa nominal. 
d) Variável qualitativa ordinal. 


Classifique as variáveis a seguir, de acordo com as informações acima: 


a) ( ) Cor dos olhos das pessoas. 

b)( ) Índice de liquidez nas indústrias do Maranhão. 
c) ( ) Produção de café no Brasil. 

d)( ) Número de defeitos em aparelhos de TV. 

e) ( ) Estatura dos alunos de sua turma. 

f) ( ) Sexo. 

g)( ) Cor dos cabelos. 

h) ( ) Peso. 

i) ( ) Signo. 

j) ( ) Estatura. 

k)( ) Notas de Matemática (numéricas). 

1) ( ) Classificação em um concurso. 

m) ( ) Número de alunos em uma classe. O 


2 Relacione a coluna da direita com a da esquerda: 


Concluiu-se que uma das perguntas do questionário obteve 


Estatística 
P) statist C) respostas confusas, por ter sido mal formulada. 
b) Método C) Os resultados da pesquisa foram expostos em 3 tabelas e 7 
experimental gráficos. 
Ciência que trata de um conjunto de processos que tem por 
c) Análise dos C) objetivo a observação, classificação e análise de fenômenos 
resultados coletivos, bem como a introdução das leis a que tais fenômenos 
estejam subjacentes. 
Ao concluir uma pesquisa, observou-se, num determinado 
d) Coleta ; a ; : a 
Be ( ) universo, que 80% dos estudantes da Universidade não 
indireta Ê š ; 
simpatizam com o Cálculo. 
e) Coleta C) Aplica-se uma nova droga numa cobaia e observam-se as reações 
contínua causadas em seu organismo. 
f) Coleta 


( ) Informações obtidas num cartório de registros de imóveis. 


periódica 


Tabulam-se as respostas do questionário e calculam-se os 


respectivos percentuais. 


O Professor de Estatística efetua a chamada em todas as aulas. 


Coleta de amostra sanguínea dos possíveis portadores do vírus 


da malária numa comunidade infectada. 


g) Coleta ( 
ocasional 
h) Crítica dos ( 
dados 
i) Apuração ( 
dos dados 
j) Apresentação ( 
dos dados 


Censo demográfico do Brasil. 


3 A tabela a seguir mostra a matrícula dos alunos da escola M de Ariquemes/ 


AC, em 2000. 


TABELA 7 - MATRÍCU 


LA DA ESCOLA M DE ARIQUEMES/AC, EM 2000 


Sexo 
Série Total 
M F 
12 50 70 120 
22 40 52 92 
3 35 45 80 
42 25 35 60 
5° 16 14 30 
Total 166 216 382 


FONTE: Secretaria da Escola M — 2000 


a) Refaça a tabela acrescentando o percentual em relação ao sexo e em relação 


ao total. 


Sexo Total 
Série 
M % F % MeF % 

1° 50 70 120 

Ze 40 52 92 

3e 35 45 80 

42 25 35 60 

5a 16 14 30 
Total 166 216 382 


b) Refaça a tabela, excluindo o sexo e acrescentando a proporção em relação 
ao total. 


Total 
Série 
MeF Proporção 

1º 120 

22 | 92 | 

32 | 80 | 

e |a] 

5º 30 

Total 382 


4 Faça o arredondamento para duas casas decimais dos números a seguir: 


a) 3,37647887 f) 4321,7563 
b) 143,987654 g) 12,005 

c) 63245,215 h) 900,995 

d) 897,465 i) 111,0009 

e) 4578,1855 j) 7865434,213 


5 Faça o arredondamento para uma casa decimal dos seguintes números: 


a) 114,376 f) 157,55 

b) 135654,0099 g) 1,3333333 

c) 543,1111 h) 1,99 

d) 4,666666 i) 915,009 

e) 31246,05 j) 12,12211221 


6 Arredonde para inteiro. 


a) 738,98 f) 219,2 
b) 123,55 g) 21,121212 
c) 90765,501 h) 90,99999 
d) 54,987320 i) 5,55555555555 
e) 124,8 j) 99,54331 
[0] 
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TÓPICO 4 


AMOSTRAGEM 


| INTRODUÇÃO 


Muitos trabalhos de pesquisa são realizados com o uso de amostras, e são 
vários os fatores que podem levar um pesquisador a se decidir por esse tipo de 
levantamento de dados. 


Inicialmente, vamos diferenciar os termos População e Amostra para, 
posteriormente, entender quando se deve usar ou não a técnica da amostragem. 


O termo população se refere a todos os indivíduos ou a todos os objetos 
do grupo em que estamos interessados. Uma amostra é um conjunto de elementos 
extraídos da população com o objetivo de conhecer determinadas características 
da população em estudo, sem a necessidade de consultar toda essa população. 
Eis alguns exemplos: 


e população: os 31 sabores de sorvete em uma sorveteria, 
amostra: cinco sabores testados para saber se a confeitaria vende sorvetes de 
boa qualidade; 


e população: todos os eleitores do Brasil, 
amostra: 3.000 eleitores entrevistados em uma pesquisa Ibope; 


e população: todos os cidadãos brasileiros que têm televisores, 
amostra: cidadãos investigados pelo serviço de pesquisa de audiência; 


e população: todos os cidadãos do Brasil, 
amostra: os 100.000 entrevistados na pesquisa mensal feita pelo IBGE. 


Portanto, o objetivo deste tópico é apresentar os tipos de amostragem que 
existem e como determinar o tamanho mínimo necessário de uma amostra para 
que os resultados da pesquisa sejam eficientes. 


2 AMOSTRAGEM 


Pode-se perguntar por que estudar amostras em lugar de populações. 
No caso de escolhermos uma amostra que não represente bem o todo, faremos 
predições inexatas ao tentar estimar as características da população com base na 
amostra (acharemos que a característica da população é uma quando na verdade 
é outra). Esse risco não correremos se estudarmos toda a população. Há, entre- 
tanto, várias razões para estudar partes (amostras) em lugar do todo (populações). 
As mais importantes são o custo excessivo e/ou a dificuldade de estudar toda a 
população. Qualquer administrador se depara com o problema de limitação de 
recursos. Não seria sensato utilizar recursos para cobrir a despesa decorrente do 
estudo completo se as predições feitas com base em uma amostra apresentarem 
quase a mesma precisão. (A essa altura, você deve estar se perguntando: Como 
sabemos que uma amostra pode representar adequadamente um todo? Essa 
é uma das questões mais importantes que serão respondidas neste tópico.) O 
governo está sujeito aos mesmos tipos de limitação. Seria altamente dispendioso 
calcular mensalmente a taxa de desemprego, contando efetivamente o número 
total de desempregados no país. Em lugar disso, calcula-se a taxa de desemprego 
com base na Pesquisa Mensal de Emprego do IBGE, que é uma amostra mensal 
realizada nas seis principais regiões metropolitanas do Brasil. Não obstante, há 
situações em que se estuda o conjunto completo. A cada quatro anos, ou por 
ocasião das eleições presidenciais/estaduais ou das municipais, pesquisam-se as 
preferências de toda a população votante, e a cada dez anos, igualmente, faz-se 
um censo completo. 


Há outras razões para se estudar somente amostras. Em alguns casos, o 
processo de pesquisa destrói o elemento pesquisado. Suponhamos, por exemplo, 
que queiramos medir o esforço que um poste pode suportar sem se quebrar. 
Obviamente, não é possível estudar toda a população de postes, pois não sobraria 
nenhum inteiro. Em outras ocasiões, não se pode ter acesso a toda a população, por 
exemplo, para determinar características dos dinossauros. Às vezes pode haver 
mais precisão numa amostra do que no todo. Por exemplo, se estamos fazendo 
uma pesquisa que exige o emprego de entrevistadores bem treinados, teremos 
maior chance de obter bons resultados se tivermos de treinar apenas um número 
de entrevistadores suficientes para realizar alguns milhares de entrevistas, e não 
alguns milhões. 


Sendo assim, pode-se dizer que: 


e População: ao conjunto de entes portadores de, pelo menos, uma característica 
comum denominamos população estatística ou universo estatístico. Assim, os 
estudantes, por exemplo, constituem uma população, pois apresentam pelo 
menos uma característica comum: são os que estudam. Como em qualquer 
estudo estatístico, temos em mente pesquisar uma ou mais características dos 
elementos de alguma população, esta característica deve estar perfeitamente 
definida. Isto se dá quando, considerando um elemento qualquer, podemos 
afirmar, sem qualquer ambiguidade, que esse elemento pertence à população. 


É necessário, pois, existir um critério de constituição da população, válido para 
qualquer pessoa, no tempo ou no espaço. Por isso, quando pretendemos fazer 
uma pesquisa entre os alunos das escolas de 1º grau, precisamos definir quais 
são os alunos que formam o universo: os que atualmente ocupam as carteiras 
das escolas, ou devemos incluir também os que já passaram pela escola? É 
claro que a solução do problema vai depender de cada caso em particular, 
essencialmente do que queremos pesquisar. 


e Amostra: na maioria das vezes, por impossibilidade ou inviabilidade econômica 
ou temporal, limitamos as observações referentes a uma determinada pesquisa 
a apenas uma parte da população. A essa parte proveniente da população 
denominamos amostra. Assim, amostra é um subconjunto finito de uma população. 


A amostragem é naturalmente usada em nossa vida diária. Por exemplo, 
para verificar o tempero de um alimento em preparação, podemos provar (observar) 
uma pequena porção deste alimento: estamos fazendo uma amostragem, ou seja, 
extraindo do todo (população) uma parte (amostra), com o propósito de avaliarmos 
(inferirmos) a qualidade de tempero do alimento como um todo. 


Nas pesquisas científicas em que se deseja conhecer algumas 
características de uma população, também é muito comum observar apenas uma 
amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores 
aproximados, ou estimativas, para as características populacionais de interesse. 
Esse tipo de pesquisa é usualmente chamado de Levantamento por Amostragem. 


Num levantamento por amostragem, a seleção dos elementos que serão 
efetivamente observados deve ser feita sob uma metodologia adequada, de tal 
forma que os resultados da amostra sejam informativos, para avaliar características 
de toda a população. 


2.1 POR QUE AMOSTRAGEM? 


São quatro as razões básicas que levam o pesquisador a trabalhar com 
amostragem: 


a) Economia: quanto maior a amostra, maior o custo de obtenção dos dados. 


b) Tempo: muitas vezes o fator tempo é determinante numa pesquisa. Por 
exemplo, em uma pesquisa epidemiológica ou de boca de urna, não haveria 
tempo suficiente para se abordar toda a população, mesmo havendo recursos 
financeiros disponíveis. 


c) Confiabilidade dos dados: considera-se o fator “fadiga” como elemento 
limitador das potencialidades humanas. No caso de uma amostra, pode-se 
dedicar mais atenção aos casos individuais, evitando erros de mensuração e/ 
ou processamento (geralmente é mais eficiente estudar um grupo pequeno de 
forma intensiva do que estudar um grande grupo de maneira superficial). 


d) Operacionalidade: é mais fácil realizar operações de pequena escala. Um dos 
maiores problemas nos grandes censos é controlar os pesquisadores. 


e) População inexistente: dinossauros. 


2.2 QUANDO NÃO USAR AMOSTRAGEM? 


Existem três razões fundamentais que não permitem ao pesquisador optar 
por amostragem em determinadas pesquisas: 


a) População pequena: sob o enfoque de amostragens aleatórias, se a população 
for pequena, ou seja, inferior a 100 elementos, usar a técnica da amostragem 
significaria inserir uma margem de erro sem reduzir significativamente o 
tamanho da amostra (toda pesquisa por amostragem tem o risco de um erro, 
esse erro é previsto e determinado, no caso de população pequena, o número 
de indivíduos da amostra representa quase toda a população. Mais adiante 
veremos como esse erro aparece no cálculo do tamanho da amostra). 


b) Característica de fácil mensuração: mesmo que a população não seja tão 
pequena, quando a variável que se quer observar é de fácil mensuração, não 
compensa investir num Plano de Amostragem. 


d) Necessidade de alta precisão: quando o parâmetro for, por exemplo, número 
de habitantes de um país, que é fundamental para o seu planejamento, esse 
parâmetro precisa ser avaliado com grande precisão. Nesse caso, pesquisa-se 
toda a população. 


3 METODOLOGIA DA AMOSTRAGEM 


Temos múltiplas e variadas formas de extrair e utilizar amostras. No 
entanto, o método a ser utilizado deve estar de acordo com os objetivos do estudo. 
Em primeiro lugar temos de determinar a população-alvo, isto é, se é composta 
por todos os consumidores que vivem numa área de influência, os clientes da 
seção ou da loja, ou só as mulheres, por exemplo. 


Uma vez definida a população, temos que elaborar uma lista desses 
elementos. Por lista entendemos a descrição de todos eles. Isso parece levantar 
alguns problemas, por exemplo: como é que obtenho a lista de todos os 
consumidores da área de influência de uma loja? Ou como é que obtenho a lista 
de todas as mulheres que compram frutas e legumes numa determinada feira? 


Nestes casos, temos que dar resposta a esta situação mudando para um 
quadro de amostragem que seja compatível com a população a estudar. 


No primeiro caso, passamos a unidade de amostragem para lares ou casas, 
o que já permite retirar apenas algumas unidades. No segundo caso, sabendo que 
há donas de casa que só compram uma vez por mês, outras uma vez por semana 
e outras uma vez por dia, teremos de selecionar elementos ao longo do mês que 
contemplem todas estas hipóteses. 


A dimensão da amostra é importante, sobretudo se pretendermos realizar 
inferência estatística e probabilidades para as médias e proporções que viermos a 
encontrar. Mais adiante veremos como isso é possível. 


Os passos seguintes serão a extração da amostra e a sua validação, isto é, 
a forma de nos assegurarmos que ela é suficientemente representativa. 


3.1 TIPOS DE AMOSTRAGEM 


Existem dois grandes grupos dentro da amostragem: a amostragem 
probabilística e a não probabilística. Nos próximos itens, descreveremos vários 
tipos de amostragem, contudo não tente decorar todos eles, o importante é saber 
de suas existências e as possibilidades para aplicar uma pesquisa. 


3.1.1 Amostragem probabilística 


Alguns tipos de amostragens probabilísticas: 


3.1.1.1 Aleatória pura 


É a cientificamente mais correta e também a que apresenta maiores desafios 
à utilização. É necessário ter uma lista exaustiva da população a estudar, ou um 
quadro em que todos os elementos dessa população estejam representados, pois 
temos que dar a todos os indivíduos igual oportunidade de serem escolhidos 
para a amostra. 


A principal vantagem da sua utilização reside no fato de permitir efetuar, 
com um erro mínimo, um cálculo de probabilidades sobre os resultados obtidos, 
sendo muito útil quando a população é pequena, quando existe uma listagem 
disponível e quando a dispersão geográfica não é um problema. 


As principais desvantagens são: 


a) a necessidade de se possuir uma lista completa de todos os elementos da 
população; 


b) o elevado custo da obtenção de informação sobre os elementos selecionados. 


3.1.1.2 Sistemática 


Consiste em selecionar um ponto de partida aleatório e em seguida 
tomar cada “n” elementos de uma lista. Ou seja: numeramos os indivíduos da 
população; sorteamos um número que será o nosso ponto de partida; como 
sabemos o número de indivíduos da população (N) e o número de indivíduos 
da amostra (n), efetuamos a divisão do número N pelo número n. Esse resultado 
será o quanto “andaremos” na fila dos indivíduos numerados da população para 
efetuar a pesquisa. 


Exemplo 1: numa população de 500 funcionários, os numeramos usando 
os números de 1 até 500. Digamos que realizamos o sorteio e saiu o número 34, 
logo esse funcionário será o primeiro pesquisado. Após efetuar os cálculos (que 
aprenderemos posteriormente), vimos que uma boa amostra dessa população é 
formada por 25 indivíduos, então fazemos a divisão de 500 por 25, o que resulta 
20. Esse 20 representa o “passo” que daremos para “escolher” outro funcionário. 
Como começamos no funcionário de número 34, vamos somando de 20 em 20 
para determinar os outros pesquisados, nesse caso seriam os funcionários de 
números: 54, 74, 94, ... 


Outros exemplos: 


e Se tivermos uma lista de 5.000 nomes e quisermos selecionar uma amostra de 
100 pessoas, primeiro escolhemos um número aleatório de 1 a 5.000 (sorteio) e 
depois escolhemos cada quinquagésimo (5.000 : 100) elemento a partir desse. 


e Se tivermos uma lista telefônica de 50 páginas e quisermos uma amostra de 100 
pessoas, podemos selecionar duas pessoas por página, isto é, a 5º da primeira 
coluna, a 12º da terceira coluna, a contar de baixo etc. 


e Escolher cada vigésima pessoa que entre na loja etc. 


3.1.1.3 Estratificada 


A população é dividida em categorias que são mutuamente exclusivas 
(nenhum elemento da população pode pertencer a mais de uma categoria) 
e coletivamente exaustivas (juntando os indivíduos de todas as categorias, 
chegamos a todos os indivíduos da população); depois, a cada estrato é efetuada 
uma amostra aleatória. 


A metodologia é semelhante à das quotas, que veremos adiante. No entanto, 
utilizam-se técnicas probabilísticas de seleção dos elementos de cada estrato. 


A amostragem estratificada pode ser: proporcional ou uniforme. 


Amostragem estratificada proporcional: neste caso específico, a 
proporcionalidade do tamanho de cada estrato da população é mantida na 
amostra, ou seja, se o estimador for de 20%, por exemplo, cada estrato terá uma 
representatividade de 20% do seu tamanho na amostra. 


A amostragem estratificada proporcional garante que cada elemento da 
população tem a mesma probabilidade de pertencer à amostra. 


Para entender melhor essa proporcionalidade, pense no seguinte: o Brasil, 
por exemplo, é dividido em estados. Como há mais pessoas no Estado de São Paulo 
que no Estado do Acre, para efeitos de uma pesquisa será interessante pegar mais 
elementos de São Paulo que do Acre. Para definir quanto pegar de cada estado, usa- 
se a proporção entre a população do estado e a população do Brasil. 


Amostragem estratificada uniforme: seleciona-se a mesma quantidade 
de elementos de cada estrato. 


Esse tipo de amostragem é muito utilizado em situações em que o maior 
interesse é obter estimativas separadas para cada estrato, ou ainda, quando se 
deseja comparar os diversos estratos, como, por exemplo: comparar rendimento 
entre as turmas de um mesmo curso e/ou comparar cursos entre si, de uma mesma 
instituição onde é aplicada uma mesma metodologia de trabalho etc. 


Exemplo: 


Se pretendêssemos efetuar um estudo de atitudes sobre a venda de sumos 
exóticos, estratificariamos a população em categorias de idades. Divide-se a 
população em conjuntos mutuamente exclusivos e internamente homogêneos, 
dos quais se faz uma amostra aleatória por grupos e destes um censo ou uma 
nova amostra em cada um dos grupos selecionados. É especialmente útil quando 
o custo de atingir todos os indivíduos é elevado. 


3.1.1.4 Amostragem por conglomerados 


Ao contrário da estratificada, a amostragem de conglomerados tende a 
produzir uma amostra que gera resultados menos precisos, quando comparada 
com uma amostra aleatória simples de mesmo tamanho. 


Entende-se por conglomerado um grupamento de elementos da 
população. Por exemplo, uma população de domicílios de uma cidade, os 
quarteirões formam conglomerados de domicílios. Porém há de se convir que as 
características de um conglomerado tendem a ser muito mais heterogêneas do 
que a de um estrato, uma vez que os indivíduos de um estrato são definidos pelo 
pesquisador, enquanto que os de um conglomerado não. 


Exemplo: 


Suponhamos que queremos obter uma amostra de todos os clientes de 
uma área de influência, para avaliarmos a sua atitude relativamente a uma série 
de produtos que pretendemos comercializar. Passos a tomar: 


1 Lista-se a área de influência em vários bairros. 
2 Tira-se uma amostra aleatória desses bairros. 


3 Tira-se uma nova amostra aleatória dentro de cada um dos bairros selecionados 
ou, eventualmente, um censo — o que significa todos os indivíduos. 


3.1.2 Amostragem não probabilística 


Quanto às amostras não probabilísticas, elas se caracterizam, sobretudo, 
por não ser possível assegurar que sejam representativas de toda a população; 
daí se segue que não podemos determinar a sua dimensão, de modo a reduzir o 
erro, nem inferir o grau de confiança para os parâmetros da população que nos 
interessam. Eis alguns tipos de amostras não probabilísticas mais comuns. 


O grau de confiança é definido pelo pesquisador no planejamento da pesquisa 
e interfere no tamanho da amostra. Parâmetros é o nome dado às medidas que podemos 
calcular de uma amostra ou população (média, moda, mediana, desvio padrão). Estudaremos 
esses parâmetros nas próximas unidades. 


3.1.2.1 Amostragem de conveniência 


Utilizam-se determinados indivíduos por uma razão muito simples — 
porque eles estão ali. Este tipo de amostra não tem qualquer valor científico, não é 
representativo e qualquer aumento da sua dimensão só conduz a conclusões ainda 
menos precisas. Pode ser e é efetivamente utilizado como ferramenta exploratória. 


3.1.2.2 Amostragem propositada 


Usam-se elementos determinados porque esses, e só esses, respondem a 
determinados critérios. 


3.1.2.3 Amostragem por quotas 


E das mais utilizadas, apesar de não ser cientificamente correta. Nesta, a 
população é dividida em subcategorias e os elementos da amostra são escolhidos 
de acordo com quotas e critérios previamente estabelecidos. 


3.1.2.4 Amostragem ajuizada ou escolhida Gulgamento) 


É aquela que o investigador acredita ser representativa da população. Neste 
caso, a amostra será tão boa quanto melhor tenha sido o juízo do pesquisador ou 
perito, o que nem sempre conhecemos na partida. É muito utilizada em mercados 
de dimensão reduzida, nos quais existem peritos com um conhecimento muito 
profundo e pormenorizado dos elementos que constituem a sua população. 


3.1.2.5 Estudos comparativos 


Em muitos casos, o principal objetivo é comparar certas características em 
duas ou mais populações. 


Para se comparar, por exemplo, o hábito de fumar entre a população de 
indivíduos com câncer no pulmão e a população de indivíduos sadios, podemos 
usar duas amostras de indivíduos: uma composta de pessoas com câncer no 
pulmão e outra de pessoas sadias. 


Neste contexto, a principal preocupação no Plano de Amostragem é obter 
amostras comparáveis, ou seja, que se diferenciem somente com respeito ao fator 
de comparação. A idade, o sexo, a escolaridade, o nível social etc. devem ser o 
mais parecido possível nas duas amostras. 


4 TAMANHO DE UMA AMOSTRA 


Para se determinar o tamanho de uma amostra de modo que ela seja 
representativa do seu universo, e que seus resultados possam gerar confiabilidade, 
devem-se seguir as quatro etapas descritas a seguir. 


4.1 TAMANHO MÍNIMO DE UMA AMOSTRA ALEATÓRIA 
ESTRATIFICADA PROPORCIONAL 


Serão quatro as etapas a serem percorridas para se determinar o Tamanho 
Mínimo de uma Amostra: 


1º Etapa: Cálculo da Amostra Ideal: 


2º Etapa: Cálculo da Amostra Mínima: 


E N-n 
N +n 
n 


3º Etapa: Cálculo do Estimador da Amostra: x = — 


4º Etapa: Aplicação do Estimador aos Estratos (cada categoria): (estrato) - x 
Sendo: 
N = Tamanho da População; 


n= Tamanho da Amostra; 
n, = Tamanho da Amostra Ideal (primeira aproximação); 


E, = Erro Amostral Tolerável (admissível). 


Sempre utilize o erro amostral tolerável na forma de coeficiente. Ou seja: 


5% = Es =0,05, ou ainda: 1% = Es =0,01. 
100 100 


Exemplo 1: planeja-se um levantamento por amostragem para avaliar 
diversas características da população de estudantes da Instituição X. Estas 
características (parâmetros) são especialmente: idade média, renda per capita, local 
de origem etc. Utilizando a tabela a seguir com dados referentes a 2006, qual deve 
ser o tamanho mínimo de uma amostra aleatória simples, por curso (estratos), tal 
que possamos admitir que o risco de estarmos errados não ultrapassem 5%? 


TABELA 8 — MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA INSTITUIÇÃO X 


EM 2006 
CURSO ALUNOS AMOSTRA 
CEX 870 
COM 662 
DIR 1555 
FIN 245 
MDA 529 
MKT 340 
PEP 2423 
TOTAL 6624 
FONTE: Secretaria da Instituição X 


Para determinar o número de indivíduos de cada curso para fornecer a 
amostra, seguimos as 4 etapas citadas anteriormente: 


1º etapa: cálculo da Amostra Ideal: (lembrete: E, = Erro amostral = 5% = 0,05) 


1 1 1 1 
n = -= z= = = 400 alunos 
(E) (0,05) 0,05.0,05 0,0025 


2º etapa: cálculo da Amostra Mínima: (Lembrete: N = população, ou seja, 
soma de todos os alunos dos cursos = 6624.) 


E Nin, _ 6624400 2649600 


=377,221 = 378 alunos 
N+n, 6624+400 7024 


Note que apesar do arredondamento para inteiro do número 377221 ser 
377, usamos 378. Para tamanho de amostra, sempre arredondamos para cima, isso é para 
garantirmos o tamanho minimo da amostra e ficarmos abaixo do erro amostral admitido. 
Pelo mesmo motivo, também arrendondamos para cima o estimador da amostra. 


3º etapa: cálculo do Estimador da Amostra: 


= n 
“SN 
378 

X= 6624 
x = 0,0571 


4º etapa: aplicação do Estimador aos Estratos: (estrato) - x 


(Lembrete: nesta etapa deve-se multiplicar a quantidade de alunos de 
cada curso pelo valor do estimador.) 


CEX: 870 - 0,0571 = 49,677 = 50 alunos 
COM: 662 : 0,0571 = 37,8002 = 38 alunos 
DIR: 1555 - 0,0571 = 88,7905 = 89 alunos 
FIN: 245 - 0,0571 = 13,9895 = 14 alunos 
MDA: 529 - 0,0571 = 30,2059 = 31 alunos 
MKT: 340 - 0,0571 = 19,414 = 20 alunos 
PEP: 2423 - 0,0571 = 138,3533 = 139 alunos 


TOTAL da amostra = 381 alunos. (Obs.: os valores de cada turma foram 
arredondados em função de ser uma variável discreta — pessoas. Além disso, para 
garantir o erro mínimo, temos que arredondar sempre para cima, não importando 
os dígitos decimais.) 


CURSO ALUNOS AMOSTRA 

CEX 870 50 
COM 662 38 

DIR 1.555 89 

FIN 245 14 
MDA 529 31 
MKT 340 20 

PEP 2.423 139 


TOTAL 6.624 381 


RESUMO DO TÓPICO 4 


Neste tópico você viu: 


e A amostragem consiste no processo de seleção e escolha dos elementos de uma 
população para formar uma amostra. 


e Os fatores que podem levar um pesquisador a se decidir por amostragem são: 


1 Fator eficiência — geralmente é mais eficiente estudar um grupo pequeno de 
forma intensiva do que estudar um grupo grande de maneira superficial. 

2 Fator tempo — é necessário tempo disponível para a realização de um 
trabalho de pesquisa. Trabalhar com uma amostra sempre reduz o tempo 
destinado à obtenção das informações. 

3 Fator econômico — os custos envolvidos em uma pesquisa são sensivelmente 
menores quando o trabalho é realizado com uma amostra. 


e Existem dois grandes grupos dentro da amostragem: 


1 Amostragem probabilística, que pode ser: amostragem aleatória pura, 
sistemática, estratificada (proporcional e uniforme) e por conglomerados. 

2 Amostragem não probabilística: de conveniência, propositada, por quotas 
e ajuizada. 


Lembre-se: 
e Como é dispendioso, dificil e por vezes impraticável ter acesso a toda uma população, 
costuma-se escolher uma amostra e estudá-la. 
e Para evitar predições imprecisas, é essencial que a amostra represente efetivamente a 
população da qual foi extraída. 


AUTOATIVIDADE 


1 Para lançar no mercado um novo perfume, pediu-se a 200 pessoas, escolhidas 
aleatoriamente, que o cheirassem e dissessem se gostavam ou não do odor. 
Esse tipo de procedimento representa um censo ou uma amostragem? 
Justifique. 


2 Para realizar um estudo sobre o tempo gasto, em minutos, por 60 indivíduos 
de um clube de karting num circuito de 20 voltas, registrou-se o tempo gasto 
por 16 desses elementos. Os resultados foram os seguintes: 


14,1 13,5 15,0 16,2 17,6 18,7 13,1 15,4 
16,6 17,2 14,8 15,9 18,0 16,3 14,9 14,3 


a) Indique a população e a amostra. 
b) Indique a variável estatística do estudo e classifique-a. 


3 Planeja-se um levantamento por amostragem para avaliar diversas 
características da população de estudantes da Instituição “A”. Estas 
características (parâmetros) são especialmente: idade média, renda per capita, 
local de origem etc. Utilizando a tabela a seguir, com dados referentes a 2006, 
qual deve ser o tamanho mínimo de uma amostra aleatória simples, tal que 
possamos admitir que os erros amostrais não ultrapassem 4%? 


TABELA 9 — MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA 
INSTITUIÇÃO A EM 2006 


Curso Alunos Amostra 
CEX 287 
CON 266 
DIR 555 
FIN 245 
INF 329 
MDA 340 
MKT 423 
NEF 270 
PEP 370 
REH 357 
REP 110 
TUR 194 
TOTAL 


FONTE: Secretaria da Instituição A 


4 Como administrador de uma grande empresa presente em diversos países, 
cujo número de funcionários é apresentado na tabela a seguir, você fará uma 
pesquisa por amostragem estratificada proporcional, levando em conta um 
erro de, no máximo, 5%. Qual será o número mínimo de funcionários de cada 
país coletado para a amostra? 


País Funcionários AMOSTRA 
Argentina 1.050 
Brasil | 8.090 
China | 18675 
EUA | 12000 
Índia | 10000 
Japão | 6500 
Rússia 8.000 
TOTAL 


50 


UNDADE 1 TÓPICO 5 


SÉRIES ESTATÍSTICAS - APRESENTAÇÃO TABULAR E 
GRÁFICA 


| INTRODUÇÃO 


Todos os dias, nas mais diferentes situações, nos deparamos com um 
amontoado de informações, provenientes de inúmeras fontes, às vezes mais ou 
menos confiáveis, que suscitam inúmeras interpretações, já que os efeitos de verdades 
também podem ser construídos pelos homens e mulheres que fazem a história. 


Partindo desse pressuposto, faz-se necessário pensar a respeito de como 
as informações também podem ser fruto de distorções, de interesses. Nesse 
sentido, precisamos de alguns critérios científicos para organizar melhor os 
dados coletados sobre determinado assunto, de modo que esses dados possam 
constituir-se em informações, considerando estas como o resultado de uma 
organização, transformação e/ou análise de dados, ou seja, como o resultado do 
tratamento de um conjunto de dados de modo a produzir significado. 


Desse modo, ao coletarmos dados, principalmente quantitativos, sobre 
determinado assunto, temos uma tarefa inicial bastante importante, que é 
a organização dos dados. Na verdade, trata-se da sua condensação, isto é, do 
agrupamento de forma mais consistente dos dados. Para isso, geralmente 
utilizamos tabelas. 


Uma das vantagens de usar uma tabela é que, além de condensar as 
informações necessárias, ela também propicia uma visualização melhor dos dados. 


E nessa direção que gostaríamos de seguir, no sentido de perceber os 
elementos essenciais que constituem uma tabela, de construir e pensar situações 
em que elas certamente podem nos auxiliar. 


2 TABELAS 


A seguir, passamos a apresentar os elementos essenciais e complementares 
de uma tabela. 


Exemplo: 


MATRÍCULA INICIAL DOS ALUNOS NO CURSO DE EDUCAÇÃO FÍSICA DA FURB — 1990-1994 


Nº de alunos 
253 o 
212 
200 


FONTE: Rs | 


2.1 ELEMENTOS ESSENCIAIS DE UMA TABELA 


Existem alguns elementos indispensáveis para se constituir uma tabela. 
São eles: o título, o corpo, o cabeçalho, a coluna indicadora e a fonte. 


A - O título é uma indicação que precede a tabela e que contém, 
obrigatoriamente, a designação do fenômeno observado, o local e a época em que 
ocorrem. Ele deve ser centrado no topo da tabela, não ultrapassando a largura da 
mesma e lembrando que as letras de cada palavra do título devem ser maiúsculas. 
Outra coisa a ser observada em relação ao título é que, embora ele possa ocupar mais 
do que uma linha, isso é, ser relativamente longo, não pode perder a objetividade, 
respondendo às seguintes questões: 


O QUÊ? (referente ao fato); 

ONDE ? (relativo ao lugar); 

QUANDO? (correspondente ao tempo). 

B - Corpo - conjunto de linhas e colunas que contém informações sobre 
a variável em estudo. O corpo é compreendido pelo conjunto de informações 


acerca do fenômeno estudado, informações estas reunidas no conjunto de linhas 
e colunas da tabela. 


Podemos observar, via de regra, que as tabelas apresentam dois traços 
no alto, delimitando o cabeçalho, e outro embaixo, fechando a tabela. Já as suas 
laterais apresentam-se sempre abertas. 


Outro aspecto importante é que, na parte inferior da primeira coluna 
da tabela, quando for necessário, deverá ser anotado o total (soma) dos valores 
observados do fenômeno. 


Você deve estar se perguntando: mas por que eu devo seguir tantos 
detalhes, tantas minúcias? Lembre-se, trata-se de um cuidado diretamente 
relacionado à seriedade no tratamento dos dados, porque se apresentarmos 
dados de qualquer jeito, possivelmente, estes permitirão diferentes interpretações 
e, nesse caso, qual a seriedade dos resultados? E mais, qual será a relevância da 
pesquisa? Tudo isso pode ser questionado caso não fiquemos atentos a detalhes. 


Ainda no sentido de compreender o corpo da tabela, é importante 
perceber que o cruzamento de uma linha com uma coluna é denominado casa ou 
célula. Essas casas nunca devem ficar em branco; se necessário, utilizamos sinais 
convencionais, que são símbolos para garantir a padronização das tabelas. 


De acordo com a Resolução 886 do IBGE (Instituto Brasileiro de Geografia 
e Estatística), nas casas ou células devemos colocar: 


e Um traço horizontal (-) quando o valor é zero. 
e Três pontos (...) quando não temos os dados. 


e Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de 
determinado valor. 

e Zero (0) quando o valor é muito pequeno para ser expresso na unidade 
utilizada. 


C — Cabeçalho — parte superior da tabela que especifica o conteúdo das 
colunas, ou seja, a identificação do que está sendo apresentado em cada uma das 


colunas da tabela. 


D - Coluna indicadora — parte da tabela que objetiva especificar o 
conteúdo das linhas e, geralmente, fica localizada na primeira coluna. 


E-—Linhas — retas imaginárias que facilitam a leitura, no sentido horizontal. 
F — Casa ou célula — espaço destinado a um só número. 
Numa tabela há ainda a fonte (indicação do órgão ou entidade responsável 


pelo fornecimento dos dados), notas e chamadas colocadas de preferência no 
rodapé. 


Deve-se mencionar sempre a origem dos dados que estão sendo apresentados. 
Quando a tabela for montada pelo pesquisador, a fonte será 'o pesquisador” e quando a tabela 
for criada com dados sem fonte alguma, esta será hipotética. 


2.2 ELEMENTOS COMPLEMENTARES 


Como o próprio nome sugere, elementos complementares são aqueles 
que complementam a tabela, mas nem sempre são obrigatórios. Esses elementos 
têm a função de explicar melhor a tabela, seja sobre a metodologia adotada ou 
outras informações relevantes para a compreensão dos dados. Seguem alguns 
exemplos de elementos complementares: 


e Notas são informações destinadas ao esclarecimento ou conceituação do 
conteúdo das tabelas (como um todo), ou à indicação da metodologia adotada 
na coleta ou elaboração dos dados. A nota deve ser inserida logo abaixo da fonte. 


e Chamadas são informações de natureza específica sobre determinada parte 
da tabela, destinadas a conceituar ou esclarecer os dados. Elas devem ser 
indicadas por algarismos arábicos entre parênteses, no corpo da tabela, à 
direita da coluna, na casa que se quer esclarecer. As chamadas são inseridas 
logo após a nota. 


Veja a seguir uma tabela que exemplifica todos os elementos essenciais e 
complementares vistos até aqui: 


Veremos agora os principais elementos que compõem uma tabela: 


ill = DE ALUNOS DO ENSINO A DISTÂNCIA — UNIASSELVI — 2001 
(POR MUNICÍPIO DO ESTADO DE SANTA CATARINA) 
pot o a it En aÃ ch mi tod a 


Municipios N' de Alunos 
Florianópolis | 12.900 
= z Tubarão 8.900 e a 
o , Blumenau 4.600 ( E AV UM ) 
Í Concórdia 460 a a S 
Joinville a o ce 
/ Coluna N Riodo Sul -————/ Odado \ 
( indicadora ) Lages 2.300 TN Smo A 
mon Chapecó") o~ RE 
São José 1100 = ee 
‘n O valor do dado é N 
Capivari de 18.560 
. menor do que o da 
Balo N, unidade adotada 


FONTE: Dados hipotéticos a Ed 
Nota: Só foram considerados os maiores municipios. = 
(1) Não inclui os alunos que ingressaram em 2002. 


3 SÉRIES ESTATÍSTICAS 


Caro/a acadêmico/a, você estudou até o presente momento os elementos 
fundamentais de uma tabela. Agora, vamos observar que existem tipos específicos 
de tabelas e alguns critérios para classificá-las. Essas tabelas são conhecidas como 
séries estatísticas. 


Uma vez coletados, os dados precisam ser dispostos de maneira a 
transmitir a informação desejada, ou seja, a quantificação que eles representam. 
Os dados são então dispostos sob a forma de tabelas para representar grandezas, 
quantidades absolutas ou posições relativas do fenômeno estudado. A esse 
conjunto de informações assim dispostas chamamos séries estatísticas. 


Denominamos série estatística toda tabela que apresenta a distribuição 
de um conjunto de dados estatísticos em função da época, do local ou da espécie. 
Podemos diferenciar uma série estatística pela existência de três elementos ou 
fatores: o tempo, o espaço e a espécie. Por isso, podemos classificar uma série em: 


3.1 SERIES HISTÓRICAS, CRONOLÓGICAS OU TEMPORAIS 


Descrevem os valores da variável em determinado lugar, discriminados 
segundo intervalos de tempo variáveis. São também denominadas cronológicas 
ou históricas, por terem a época como critério específico que as diferencia. Neste 
caso, o tempo varia, enquanto o local e o fato permanecem fixos. 


TABELA 10 - APROVAÇÃO NO ENSINO FUNDAMENTAL SÃO PAULO/SP — 


1990/1999 
ANO APROVAÇÃO (%) 
1990 72,1 
1991 74,1 
1992 74,8 
1993 78,4 
1994 78,5 
1995 81,2 
1996 81,6 
1997 82,7 
1998 82,3 
1999 82,1 


FONTE: Prefeitura Municipal de Florianópolis 


Fenômeno: aprovação no Ensino Fundamental (elemento fixo); 
Local: São Paulo/SP (elemento fixo); 


Época (tempo): de 1990 a 1999 (elemento variável). 


3.2 SERIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS OU DE 
LOCALIZAÇÃO 


Descrevem os valores da variável, em determinado instante, discriminados 
segundo regiões. Também são chamadas de séries territoriais, por terem o local 
como o critério específico que as diferencia. Neste caso, o local varia, enquanto o 
tempo e o fenômeno permanecem fixos. 


TABELA 11 - OCUPAÇÃO DA ÁREA DO BRASIL POR REGIÃO - 1980 


Porcentagem de 


Regiões Ocupação 
Norte 45 
Nordeste 18 
Sudeste 11 
Sul 7 
Centro-Oeste 19 


FONTE: Os autores 
Fenômeno: ocupação da área (fixo); 
Local: regiões do Brasil (variável); 


Tempo: 1980 (fixo). 


3.3 SERIES ESPECÍFICAS OU CATEGÓRICAS 


Descrevem os valores da variável em determinado tempo e local, 
discriminados segundo categorias. Também são chamadas de séries categóricas, 
por terem o fenômeno como critério específico que as diferencia. Neste caso, o 
fenômeno varia, enquanto o tempo e o local permanecem fixos. 


TABELA 12 - CONCEITUAÇÃO DAS BIBLIOTECAS ESCOLARES BRASILEIRAS - 1995 


Conceito Alunos (%) 
Bom 4 
Regular 40 
Ruim 12 
Sem Conceito 44 
TOTAL 100 
FONTE: Sistema Nacional de Avaliação da Educação Básica — SAEB/MEC 
Nota: Só foram consideradas as bibliotecas frequentadas por alunos da 
4º série do Ensino Fundamental. 


Fenômeno: conceitos das bibliotecas (variável); 
Local: Brasil (fixo); 


Tempo: 1995 (fixo). 


3.4 SERIES CONJUGADAS 


Também chamadas mistas, as séries conjugadas consistem em uma 
combinação de duas séries (temporal, geográfica ou especificativa). 


Fique atento/a! Para fins de classificação nas séries conjugadas, a leitura sempre 
se fará a partir da coluna indicadora, seguida do cabeçalho. 


Exemplos: 


a) Série Específica - Histórica: neste caso, o fenômeno (conceito) e o tempo 
variam, enquanto o local permanece fixo. 


TABELA 13 - CONCEITUAÇÃO DAS BIBLIOTECAS ESCOLARES BRASILEIRAS — 
1995/1996 
Conceito 1 P, 
Alunos (%) Alunos (%) 

Bom 4 7 

Regular 40 38 

Ruim 12 12 

Sem Conceito 44 43 

TOTAL 100 100 


FONTE: Sistema Nacional de Avaliação da Educação Básica - SAEB/MEC 

Nota: Só foram consideradas as bibliotecas frequentadas por alunos da 4º série do 
Ensino Fundamental. 

(1) Os dados são estimativas. 


b) Série Geográfica — Histórica: neste caso, o local e o tempo variam, enquanto o 


fenômeno permanece fixo. 


TABELA 14 — TERMINAIS TELEFÔNICOS EM SERVIÇO NO BRASIL — 1991/1993 
Regiões 1991 1992 1993 
Norte 342.938 375.658 403.494 
Nordeste 1.287.813 1.379.101 1.486.649 
Sudeste 6.234.501 6.729.467 7.231.634 
Sul 1.497.315 1.608.989 1.746.232 
Centro-Oeste 713.357 778.935 884.822 
FONTE: Ministério das Comunicações 


c) Série Geográfica — Específica: neste caso, a região (local) e o fenômeno variam, 


enquanto o tempo permanece fixo. 


TABELA 15 — MATRÍCULAS NA INSTITUIÇÃO X — 2006 


Campus Masculino Feminino 
Indaial 2.725 2.573 
Blumenau 2.347 2.691 


FONTE: Os autores 


d) Série Histórica - Histórica: neste caso, o tempo varia, enquanto o local e o 


fenômeno permanecem fixos. 


TABELA 16 - EMPREGOS NO BRASIL (EM MILHARES) — 1990/1999 


Meses 1996 1997 1998 1999 2000 
Jan 16.033,50 16.233,95 16.223,23 16.130,48 16.553,36 
Fev 15.908,58 16.184,34 15.980,50 16.090,38 16.628,33 
Mar 16.034,46 16.282,00 16.265,07 16.160,09 16.780,71 
Abr 16.167,81 16.309,59 16.304,37 16.144,25 17.008,16 
Mai 16.281,54 16.369,42 16.387,13 16.314,59 17.136,46 
Jun 16.278,64 16.329,66 16.336,23 16.478,22 17.128,45 
Jul 16.254,04 16.386,93 16.277,74 16.338,56 17.134,66 
Ago 16.464,76 16.301,29 16.454,64 16.346,07 17.274,06 
Set 16.680,33 16.537,15 16.547,32 16.518,07 17.361,96 
Out 16.711,36 16.587,75 16.514,04 16.585,18 17.351,09 
Nov 16.701,08 16.568,16 16.393,34 16.688,56 17.319,68 
Dez 16.509,07 16.415,92 16.409,93 16.828,28 17.318,25 


FONTE: IBGE — Pesquisa Mensal de Emprego 


e) Série Geográfica - Geográfica: neste caso, o local varia, enquanto o fenômeno 


e o tempo permanecem fixos. 


TABELA 17 - POPULAÇÃO DA MICRORREGIÃO DO MÉDIO VALE DO ITAJAÍ - 2006 


Município Rural Urbana 
Indaial 18.750 26.593 
Blumenau 93.620 193.730 
Rodeio 6.935 3.963 


FONTE: Os autores 


f) Série Específica — Específica: neste caso, o fenômeno varia, enquanto o local e 
o tempo permanecem fixos. 


TABELA 18 - CONSELHO REGIONAL DE CONTABILIDADE DO ESTADO DO PARÁ ESTATÍSTICO 
DE MOVIMENTAÇÃO CADASTRAL CATEGORIA/SEXO 


CATEGORIA HOMEM MULHER 
Cantores 1.900 2.053 
Técnicos 1.366 841 


FONTE: Departamento de Registro e Cadastro 


g) Série Geográfica — Histórica — Específica: neste caso, os três variam, enquanto 
o local permanece fixo. 


TABELA 19 — MATRÍCULAS EFETUADAS 


A INSTITUIÇÃO A - RIO DE JANEIRO - 2004/2006 


2004 2005 2006 
Campus 
Masculino | Feminino Masculino | Feminino | Masculino Feminino 
Indaial 1237 1478 1572 1601 2070 2079 
Blumenau 725 843 1057 1029 2385 2296 


FONTE: Os autores 


3.5 SERIE DE DISTRIBUIÇÃO DE FREQUÊNCIAS 


Assériesestatísticas vistas atéagora são, de maneira geral, empregadas para 
a apresentação de dados qualitativos. Para a apresentação de dados quantitativos 
(dados numéricos), emprega-se a série de Distribuição de Frequências. 


Nessa série estatística, permanecem fixos os três critérios específicos 
(época, local e fenômeno). A variação ocorre apenas na intensidade do fenômeno 
pesquisado, isso é, na sua frequência. 


Exemplo: 


Foi realizado um levantamento na comunidade carente de Piraçumi, em 
novembro de 2002, em que foram coletados os seguintes pesos (kg) de um grupo 
de 30 crianças com idade até 1 ano: 


Nesse exemplo acima, temos as seguintes características: 


Os dados obtidos são quantitativos (os pesos são números). 


e A época em que os dados foram obtidos permanece fixa (novembro de 2002). 


O local onde os dados foram obtidos permanece fixo (comunidade carente de 
Piraçumi). 


e O fenômeno estudado permanece fixo (peso das crianças). A variação ocorre 
apenas na intensidade, ou seja, no número de vezes em que o peso aparece. 


Essas características indicam que a distribuição de frequência é a forma 
adequada para apresentar esses dados em uma tabela, conforme modelo a seguir: 


TABELA 20 - PESOS DAS CRIANÇAS DA COMUNIDADE CARENTE DE PIRAÇUMI 
NOVEMBRO DE 2002 


Pesos (kg) Número de Crianças (f) 
7 5 
8 | 13 
9 | 8 
10 | 4 


FONTE: Os autores 


Nesse sentido, devemos considerar que a distribuição de frequências é 
um método de agrupamento de dados. Esse agrupamento pode ser feito de duas 
maneiras, e cada uma delas dá origem a um tipo diferente de distribuição de 
frequência. Iremos estudar os tipos de agrupamento mais adiante. 


4 GRÁFICOS 


O gráfico estatístico é um dos recursos mais utilizados para apresentar os 
dados estatísticos, cujo objetivo é o de produzir no investigador, ou no público, 
uma impressão mais rápida e viva do fenômeno em estudo: por sua visualização, 
já que os gráficos causam uma melhor compreensão do que as séries. Para 
construir um gráfico, é preciso obedecer a algumas normas: 


a) Todo gráfico deve ter título que deverá ser escrito abaixo do gráfico. 


b) No eixo das abscissas (OX), horizontal, a escala cresce da esquerda para a 
direita e é escrita embaixo do eixo. 


c) No eixo das ordenadas (OU), vertical, a escala cresce de baixo para cima, e é 
escrita à esquerda do eixo. 


d) Nos dois eixos devem estar identificadas as variáveis representadas. 
e) As linhas auxiliares (grade) são opcionais, mas auxiliam a leitura. 


f) O gráfico pode exibir no rodapé: a fonte, o pesquisador, a instituição ou o grupo 
de pesquisadores que forneceu o gráfico, ou ainda os dados que permitiram 
sua construção. Quando a coleta for indireta, faz-se necessário informar a fonte. 


A qualidade do gráfico depende de sua escolha adequada. Sabemos que o 
gráfico facilita a leitura e transmite a informação melhor que a tabela. Por isso, ele 
deve obedecer a certos requisitos fundamentais: simplicidade, clareza e veracidade. 


5 CLASSIFICAÇÃO DOS GRÁFICOS - TIPOS 


Os principais tipos de gráficos são: diagramas, cartogramas e pictogramas. 
Apresentaremos neste tópico exemplos desses gráficos. Contudo, pedimos a você que 
se concentre nos diagramas, que são os mais utilizados em apresentações científicas. 


5.1 DIAGRAMA 


Os diagramas são gráficos numéricos, geralmente com duas dimensões, 
nos quais fazemos uso do sistema cartesiano. Cada diagrama representa melhor 
uma série estatística: preste atenção: qual gráfico é mais adequado a qual série? 
Dentre os diagramas, destacamos: 


a) Gráfico de linha: usamos para apresentar uma série estatística histórica e/ou 
cronológica. 


Exemplo: 


QUADRO 2 — VARIAÇÕES DA POUPANÇA E DA NFLAÇÃO ENTRE MAIO DE 2003 E JUNHO DE 
2004 
Índices Jun. | Jul. | Ago. | Set. | Out. | Nov. | Dez. | Jan. | Fev. | Mar. | Abr. | Maio 
03 03 03 03 03 03 03 04 04 04 04 04 
Poupança | 0,92 [1,95 |0,91 |0,84 |0,82 |0,68 |0,69 |063 |0,55 |0,68 |0,59 | 0,66 
Inflação 0,42 10,55 |0,40 |0,34 |0,32 |0,18 |0,19 |013 |0,05 |0,18 10,09 | 0,15 


FONTE: IBGE — junho de 2004 


GRÁFICO 1 - VARIAÇÕES DA POUPANÇA E DA INFLAÇÃO ENTRE MAIO DE 2003 E 
JUNHO DE 2004 


FONTE: IBGE — junho de 2004 


— Poupança | 
— inflação 


Note que para fazer esse gráfico colocamos no eixo X (horizontal) os meses 
do ano e no eixo Y (vertical), a porcentagem. Depois, localizamos os pontos no 
gráfico que indicam qual a porcentagem observada para cada mês (para cada mês, 
temos um ponto). Finalmente, ligamos os pontos por meio de retas, formando 
uma linha. No gráfico, a linha de baixo representa a inflação e a linha de cima 
representa a poupança (observe a legenda). 


b) Gráfico de colunas ou barras: é usado para apresentar séries categóricas, 
cronológicas e geográficas. Sempre que os dados forem muito grandes, ou os 
nomes das variáveis muito extensos, deve-se dar preferência aos gráficos de 
barras, principalmente em séries geográficas e específicas. Numa série histórica, 


os dados devem seguir a ordem cronológica. Se a série for histórica, os dados 
(as barras ou colunas) devem estar em ordem crescente ou decrescente. A 
distância entre as barras e as colunas, por uma questão de estética, não deverá 
ser menor que a metade nem maior que ?/, da largura dos retângulos. No 
gráfico de barras, inverte-se a posição dos dados nos eixos coordenados. 


Daremos dois exemplos: no primeiro mostraremos a construção passo a 
passo, no segundo apresentaremos somente o resultado final. 


Seja a tabela: 


TABELA 21 - PRODUÇÃO DE TINTAS, EM TONELADAS, POR CORES 


Cor Quantidade 
Amarelo 13 
Azul 10 
Verde 5 
Rosa 7 
Total 35 
FONTE: Olimpíada de Astronomia - 1998 


1° passo: fazer o eixo X (horizontal) que tem que ter espaço para 4 colunas (já 
que existem quatro cores para representar). Usaremos 1 cm para as colunas e 
0,5 cm para os espaços. Como o gráfico começa e termina com espaço, teremos a 
seguinte situação. 


Eixo Y 


Amarelo Azul Rosa Verde 


2° Passo: fazer o eixo Y (vertical); a altura desse eixo será 4 cm porque ele tem que 
ter 2/3 do tamanho do eixo X que tem 6 cm (6. n 4) - Depois temos que graduar 
3 


esse eixo: cada meio centímetro do eixo Y representará 2 unidades, com isso o 
gráfico chegará a uma altura de 16, o que é suficiente porque a maior frequência 
é 13 (Amarelo). 


Rosa Verde 


3º Passo: fazer as colunas. Cada coluna terá a altura correspondente à sua 
frequência, por exemplo, a coluna da tinta amarela terá altura até o 13, porque 
tem essa frequência, a coluna da tinta azul terá altura 10, e assim por diante. 


Azul Rosa Verde 


Exemplo 2: 


TABELA 22 — VELOCIDADE DOS PLANETAS DO SISTEMA SOLAR EM MILHAS POR 
SEGUNDO - 1998 


Planeta Velocidade (milhas/segundo) 
Mercúrio 29,7 
Vênus 21,8 
Terra 18,5 
Marte 15,0 
Júpiter 81 
Saturno 6,0 
Urano 4,2 
Netuno 3,4 
Plutão 3,0 
FONTE: Olimpíada de Astronomia — 1998 


GRÁFICO 2 — VELOCIDADE DOS PLANETAS DO SISTEMA SOLAR EM MILHAS POR 
SEGUNDO 


Plutão 
Netuno 


Urano 
Satumo 
Jupiter 
Marte 
Terra 
Vênus 


Mercúrio 


FONTE: Olimpiada de Astronomia - 1998 


Nesse gráfico, colocamos o nome do planeta no eixo y (vertical) e a 
velocidade no eixo x (horizontal). Depois, em cada linha, que representa um 
planeta, fizemos uma barra do tamanho correspondente ao valor da velocidade. 
Note que, nesse exemplo, quanto maior a barra, maior a velocidade. O gráfico 
de colunas é feito da mesma maneira, só que invertido, ou seja, os nomes dos 
planetas iriam no eixo x e a velocidade no y. 


Gráfico de setores: este tipo de gráfico normalmente é utilizado nas séries 
geográficas, ou quando se pretende apresentar dados relativos, em percentuais. 
Manualmente, se a série já tiver dados relativos, devemos multiplicar o valor 
percentual por 3,6 para obter dados em graus. 


Esse valor 3,6 origina-se da regra de três, considerando que uma volta completa 


(360º) representa 100%, temos o =3,6. 


Exemplo: 


TABELA 23 — QUANTIDADE DE EXAMES REALIZADOS NO LABORATÓRIO X EM 2003 


Exames Quantidade 
Hematologia 9824 
Bioquímica 21534 
Imunologia 15432 
Parasitologia 4310 


FONTE: Os autores 


GRÁFICO 3 — QUANTIDADE DE EXAMES REALIZADOS NO LABORATÓRIO X EM 
2005 


8% 19% 


E Hematologia 
EB Bioquímica 
O Imunologia 
O Parasitologia 


FONTE: Os autores 


Como esses valores não estavam em porcentagens, o primeiro passo para 
construir o gráfico é fazer a frequência relativa (porcentagem), depois disso, 
como dito anteriormente, multiplicar por 3,6 (número oriundo da regra de três) 
para determinar o ângulo interno que representará o tamanho da “fatia”. Note 
que quanto maior a fatia, maior o valor a ser representado. 


Caro/a acadêmico/a, os próximos gráficos serão apresentados a título de 
conhecimento, pois para fazê-los manualmente é um pouco complicado. Então 
não entraremos em detalhes acerca da sua construção, apenas apresentaremos a 
ideia geral. 


d) Gráfico polar: é o gráfico ideal para apresentar séries temporais cíclicas, isto 
é, séries temporais que apresentam certa periodicidade, como, por exemplo: 
a variação da precipitação pluviométrica ao longo do ano, a variação de 
temperatura ao longo do dia, o consumo de energia elétrica ao longo do mês, o 
número de passageiros de uma linha de ônibus ao longo da semana. O gráfico 
polar faz uso do sistema de coordenadas polares. 


TABELA 24 - PRECIPITAÇÃO PLUVIOMÉTRICA NA CIDADE M - 2003 


MESES Mm Média 
Jan 49,6 
Fev 93,1 
Mar 63,6 
Abr 135,3 
Mai 214,7 
Jun 277,9 
Jul 183,6 
Ago 161,3 
Set 49,2 
Out 40,8 
Nov 28,6 
Dez 33,3 


FONTE: Os autores 


Como se faz este gráfico: 


1- Traçamos uma circunferência de raio arbitrário, ou do tamanho da média dos 
valores da série. 


2- Construímos uma semirreta, partindo do centro e com uma escala, no eixo 
polar. 


3- Dividimos a circunferência em tantos arcos quantas forem as unidades. 
4 - Traçamos semirretas passando pelos pontos de divisão. 


5 - Marcamos os valores correspondentes da variável, iniciando pela semirreta 
horizontal (eixo polar). 


6 - Ligamos os pontos encontrados com segmentos de reta. 


7 - Se pretendermos fechar a poligonal obtida, empregamos uma linha interrompida. 


— Precipitação mensal 
— Precipitação média 


FONTE: Os autores 


5.2 CARTOGRAMA 


É a representação sobre uma carta geográfica. Este gráfico é empregado 
quando se quer relacionar os dados estatísticos diretamente com as áreas 
geográficas ou políticas. Distinguimos duas aplicações: Dados absolutos são 
normalmente representados por pontos e dados relativos por hachuras ou cores. 


GRÁFICO 5 — CARTOGRAMA DE OCORRÊNCIA DE ENDEMIAS NO BRASIL - 2002 


Número de casos 
(2000) 


C] menos de 7500 
(IN 7501296000 
EEE 96001 a270000 


Adaptação Atlas Geográfico Escolar, IBGE, 2002 


FONTE: Adaptação Atlas Geográfico Escolar - IBGE - 2002 
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5.3 PICTOGRAMA 


E um dos processos gráficos que melhor fala ao público, pela sua forma 
ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras 
que substituem as barras; na verdade é um gráfico de barras/colunas “enfeitado”. 
Revistas voltadas ao público jovem se utilizam desse recurso, muitas vezes. Para 
fazer um pictograma: 

1 trace o sistema de eixos cartesianos; 
2 apresente a variável no eixo das ordenadas e a frequência no eixo das abscissas; 
3 construa as barras normalmente; 


4 substitua as barras por figuras relativas aos dados apresentados; 


5 se for necessário, faça uma legenda para indicar o número de dados que cada 
figura representa; 


6 coloque título. 


GRÁFICO 6 — PONTUAÇÃO DA EQUIPE CATARINENSE NO 
CAMPEONATO BRASILEIRO DE SURF - 2001/2003 


2001 2002 2003 
FONTE: Federação Catarinense de Surf 
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LEITURA COMPLEMENTAR 


O CÁLCULO E A VIDA MODERNA 
Antônio José Lopes Bigode 


Houve um tempo em que um indivíduo era considerado bom de Matemática 
se soubesse muito bem fazer contas. Tudo era resolvido na ponta do lápis. Mas, e 
hoje? Que desafios esperam aqueles que são os cidadãos do século 21? 


Você já pensou nas habilidades matemáticas que serão necessárias para 
enfrentar os futuros problemas? Pensemos em um dos componentes do conhe- 
cimento matemático: o cálculo. Para isso, vamos imaginar o dia a dia de um 
cidadão comum, um típico cidadão de classe média, o senhor Jota Silva. 


Seu Jota Silva foi com sua esposa fazer uma compra no supermercado. 
Foram escolhendo os produtos nas prateleiras, de acordo com os preços, a marca 
e a qualidade. Com tudo no carrinho, passaram pelo caixa. 


Nem seu Jota Silva nem sua esposa memorizaram os preços. Tinham 
apenas uma ideia da ordem de grandeza: sabiam, por exemplo, que o quilo de 
feijão custava menos de 3 reais. Seu Jota Silva reparou que o funcionário do caixa 
não precisava fazer os cálculos, nem digitar os preços, graças ao código de barras. 


Seu Jota Silva passou os olhos pelo ticket, com a indicação dos produtos 
que comprou, a quantidade e os respectivos preços. Não passou por sua cabeça 
conferir a conta. Afinal, ele deve ter pensado: as máquinas não erram. 


Até aqui, parece que as pessoas dessa história não realizaram qualquer 
operação de cálculo. 


Chegando em casa, Jota Silva abriu sua correspondência e resolveu 
conferir o extrato bancário. Foi tirando, no talão, os cheques já descontados e 
verificou quais ainda não tinham entrado. Agora, sabia aproximadamente quanto 
dispunha na conta. 


No dia seguinte, Jota Silva foi à feira, para comprar alguns legumes e frutas 
frescas. Em vez de levar o carrinho de feira, pegou a sacola; ele sabia que ia comprar 
poucas coisas, pois levou somente 10 reais, calculando “Deve dar para o gasto”. 


Aqui, seu Jota Silva realizou uma operação pouco prestigiada nos 
currículos de dez anos atrás. Ele fez uma estimativa. 


Antes de voltar para casa, o senhor Jota Silva passou pelo banco para 
pagar uma conta que havia vencido dois dias antes de ele ter recebido seu salário. 
Pensou: “Puxa!!! Vou ter de pagar uma multa de 10 por cento! A conta, que era 
de R$ 27,50, passou a ser R$ 30,25. Para fazer a conta, ele usou a calculadora que 
sempre carrega no bolso. 


Depois da feira, do banco e do almoço, uma espiada no jornal, para relaxar. 
Ele logo vê a manchete: “Malé foi comprado pelo Esporte Clube Perna de Pau por 
R$ 40.000,00”. E Jota Silva pensa: “Humm!! Daria para comprar a casa do vizinho!” 


Seu Jota Silva sabe a dimensão de algo em torno de 40 mil reais, 
relacionando com cifras familiares, como o preço da casa do vizinho. 


Mas logo vem a outra notícia “Siderúrgica foi vendida por 3,8 bilhões de 
dólares”. Será que foi caro, ou barato demais? 


Um número da ordem de bilhões de dólares não é familiar para seu Jota 
Silva. Ele não tem referências confiáveis para avaliar um número tão grande. 


Para finalizar a leitura, ele passou os olhos pela página de esportes e 
calculou as chances de seu time ir à final. 


Fez tudo de cabeça: “Ufa! Parece que vai dar. São quase 80 por cento de 
chances a favor”. 


NA SALA DE AULA 


Vamos fazer uma pausa e analisar toda essa história do ponto de vista 
do ensino. Seu Jota Silva é um homem comum, que faz relações matemáticas a 
cada momento, de acordo com suas necessidades. Sem dúvida ele realiza muitos 
cálculos, mas quase nunca precisa usar lápis e papel. 


Essa é a realidade: fora de atividades profissionais, são raras as situações 
que requerem resultados exatos. 
Quando a precisão é indispensável, 
como, por exemplo, no pagamento 
da conta com 10 por cento de multa, 
tanto os indivíduos quanto as 
empresas empregam instrumentos 
adequados, como calculadoras e 
computadores. 


- COMPETÊNCIAS DE CÁLCULO 


| 


Em suas aulas, o professor precisa propiciar situações que levem os alunos 
a usar equilibradamente as várias formas de cálculo. 


ESTIMATIVA 


CALCULO MENTAL 


CALCULO ESCRITO 


CALCULADORA 


A ideia central dessa proposição pode ser imaginada como uma mesa 
apoiada em seus quatro pés. 


O tampo da mesa corresponde às competências de cálculo. Os quatro pés 
correspondem a: cálculo escrito (compreensão dos algoritmos e propriedades); 
estimativa; cálculo mental; e uso de instrumentos como a calculadora. O ensino 
de Matemática deve saber equilibrar esses quatro pés, para evitar que nossa 
mesa fique bamba. 


A CALCULADORA E AS ESTIMATIVAS 


Um homem precisa calcular: 34 + 27 + 16; e, logo depois: 3 x 13. Se ele 
pegar um lápis e um papel, com certeza não está bem preparado. Seria também 
absurdo usar uma calculadora em uma situação tão simples. 


Agora, e se alguém lhe pedir a raiz quadrada de 234,25? E muito difícil 
imaginar outro recurso que não seja a calculadora. O algoritmo da raiz quadrada 
é peça de baú, não deve mais ser ensinado nas escolas, como era antigamente. 


Imagine agora que seja necessário, na escola ou na vida profissional, ter 
uma ideia aproximada (não exata) da medida do lado de uma sala quadrada 
cuja área é 234,25 m?. Podemos imaginar: “Deve ser uma medida entre 10 e 20 
metros”; ou então: “Deve ser algo entre 15 e 16 metros”. Uma ou outra resposta 
pode ser aceita, dependendo do grau de aproximação desejado. 


Mas pense em uma pessoa que recorre à calculadora para efetuar uma 


operação de troco do tipo R$ 20,00 - R$ 13,50. Novamente, este é um caso fácil de 
ser resolvido apenas com cálculo mental. 


Um dos papéis da escola é ensinar a decidir, com inteligência, se é mais 


adequado calcular com lápis e papel, mentalmente, com a calculadora, ou 
ainda estimar o resultado. 


Caminhamos para uma época em que saber calcular, conhecer todos os 
algoritmos e propriedades é muito importante. Mas não basta para preparar 
nossos alunos para a diversidade de situações que eles vão encontrar em suas 
vidas pessoais ou profissionais. Se é fato que as máquinas se encarregarão da 
maioria dos cálculos, resta ao indivíduo controlar esse cálculo por meio de todo 
seu acervo de conceitos, técnicas e habilidades, que estarão também a serviço de 
situações novas, diversificadas e significativas. 


FONTE: Bigode (2006) 


RESUMO DO TÓPICO 5 


Neste tópico você viu que: 


Existem alguns elementos indispensáveis para se constituir uma tabela. São 
eles: o título, o corpo, o cabeçalho, a coluna indicadora e a fonte. 


Notas e Chamadas, numa tabela, são elementos complementares. 


As séries estatísticas podem ser: cronológicas, geográficas, específicas ou 
conjugadas. 


Para a apresentação de dados quantitativos (dados numéricos), emprega-se a 
série de Distribuição de Frequências. 


Os principais tipos de gráficos estatísticos são: diagramas, cartogramas e 
pictogramas. 


Dentre os diagramas destacamos: gráfico de linhas, de colunas ou barras, de 
setores e gráfico polar. 


N 
Q 


AUTOATIVIDADE 


Resolva as seguintes atividades para que você fixe bem o conteúdo 
estudado neste tópico. 


1 Quais são as cinco regras de apresentação de uma tabela estatística? 
2 O que é uma série estatística? 
3 Como são diferenciadas as séries estatísticas? 


4 Classifique as séries seguintes em: históricas, geográficas ou específicas: 


a) TABELA 25 — PREÇO DO ACÉM NO VAREJO SÃO PAULO - 1995 A 2000 
ANO Preço Médio (US$) 
1995 2,24 
1996 2,73 
1997 2,12 
1998 1,89 
1999 2,04 
2000 2,62 
FONTE: APA 
b) TABELA 26 - DURAÇÃO MÉDIA DOS ENSINOS SUPERIORES - 1994 
PAÍSES Nº de ANOS 
Itália 7,5 
Alemanha 7 
França 7 
Holanda 5,9 
Inglaterra Menos de 4 


FONTE: Revista Veja 


c) TABELA 27 - REBANHOS BRASILEIROS - 1992 


ž QUANTIDADE 

PSF ECIES (1.000 CABEÇAS) 

Bovinos 154.440,8 
Bubalinos 1.423,3 
Equinos 549,5 
Asininos 471 
Muares 208,5 
Suínos 34.532,2 
Ovinos 19.955,9 
Caprinos 12.159,6 
Coelhos 6,1 
TOTAL 223.323,0 

FONTE: IBGE 


5 Diga quais são os três principais tipos de gráficos estatísticos. 

6 O que são diagramas e quais são os quatro tipos de gráficos em diagramas? 

7 O que é um gráfico polar? 

8 O que é um cartograma? 

9 O que é um pictograma? 

10 Na administração de um sistema escolar de certo município, 70% das 
despesas vão para o ensino, 12% para a administração e manutenção e 18% 


para órgãos auxiliares, encargos fixos e despesas ocasionais. O gráfico que 
melhor representa esta situação é: 
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UNIDADE 2 


DESCRIÇÃO DE DADOS - MEDIDAS DE 
POSIÇÃO 


OBJETIVOS DE APRENDIZAGEM 


Nessa unidade vamos: 
e dominar a terminologia, os símbolos usuais e os conceitos básicos habitu- 
almente encontrados na literatura especializada de estatística de forma a 


ler trabalhos técnicos com proveito; 


e efetuar cálculos pertinentes e necessários à obtenção dos chamados dados 
estatísticos; 


e delinear ações de coleta de dados, resumir, relatar, organizar e interpretar 
informações sob o aspecto estatístico; 


e efetuar cálculos de medidas de tendência central e dispersão de dados; 


* reconhecer e calcular separatrizes. 


PLANO DE ESTUDOS 


Esta unidade está dividida em 4 (quatro) tópicos. Ao final de cada um deles você 
encontrará atividades que contribuirão para a apropriação dos conteúdos. 


TÓPICO 1 - DISTRIBUIÇÃO DE FREQUÊNCIA 


TÓPICO 2 - REPRESENTAÇÕES GRÁFICAS DAS DISTRIBUIÇÕES DE 
FREQUÊNCIA 


TÓPICO 3 - MEDIDAS DE POSIÇÃO - TENDÊNCIA CENTRAL 


TÓPICO 4 - SEPARATRIZES 
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UNDADE 2 | TÓPICO | 


DISTRIBUIÇÃO DE FREQUÊNCIA 


| INTRODUÇÃO 


Os dados coletados através de observações são o material básico com que o 
pesquisador trabalha. As observações podem ser, por exemplo, os dados pessoais 
de um grupo de acadêmicos, produtividade de uma planta, a velocidade de 
processamento de um computador, a resistência de um indivíduo a determinada 
doença, a variedade de cores de uma flor, sexo do primeiro filho de um casal, 
a satisfação dos acadêmicos com o curso que estão fazendo, a opinião dos 
estudantes quanto à didática do professor, e muitas outras mais. 


Feita a coleta de material, é necessário organizar os dados de tal forma que 
facilite sua leitura e descrição. A organização dos dados em tabelas é chamada 
distribuição de frequência. 


2 DISTRIBUIÇÃO DE FREQUÊNCIA 


É um tipo de tabela que condensa uma coleção de dados conforme as 
frequências (repetições de seus valores). 


Tabela primitiva ou dados brutos: os dados coletados em campo e trazidos 
para o local de análise na forma como foram coletados são denominados dados 
brutos. Normalmente este tipo de dados traz pouca ou nenhuma informação 


ao leitor. E necessário então organizá-los para aumentar sua capacidade de 
informação. 


Exemplo: Sejam as seguintes notas obtidas em estatísticas: 
8256565437565472546536542536 


É difícil formarmos uma ideia exata do comportamento do grupo como um 
todo, a partir de dados não ordenados. Alguns cálculos estatísticos só são corretos se os 
dados estiverem organizados em rol. 


Rol: é a tabela obtida após a ordenação dos dados (crescente ou decrescente). 
A mais simples organização numérica, como a ordenação dos dados de forma crescente ou 
decrescente, já aumenta muito a sua capacidade de informação. 
O ROL do exemplo anterior será: 
2223334444555555555666666778 


Além desta primeira organização dos dados, podemos ainda agrupá-los 
em classes de acordo com a frequência, diminuindo assim a relação de dados e, 
ao mesmo tempo, ampliando sua capacidade de informação. 


3 TIPOS DE DISTRIBUIÇÃO DE FREQUÊNCIA 


3.1 DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE 
CLASSE 


Atente que, na maioria das vezes, quando estamos estudando os dados, 
estaremos diante de uma planilha eletrônica. Portanto, se as informações estiverem 
todas visíveis, sem a necessidade de usar a barra de rolagem, sua visualização 
será facilitada, sintetiza-se a informação e facilita-se o cálculo. 


Distribuindo então os dados em classes e contando-se o número de 
indivíduos contidos em cada classe, obtém-se a frequência da classe. A disposição 
tabular dos dados agrupados em classes, juntamente com as frequências 
correspondentes, denomina-se distribuição de frequência. 


Ainda no caso anterior, por exemplo, temos três ocorrências iguais a 2, três 
iguais a 3, quatro iguais a 4, nove iguais a 5, seis iguais a 6, duas iguais a 7 e uma 
igual a 8. Então podemos representar os dados simplesmente por uma tabela de 
distribuição de frequência, que ficará assim: 


TABELA 28 — NOTA EM ESTATÍSTICA - 2000 


i Informação Frequência (f) 
1 2 3 
2 3 3 
3 4 4 
4 5 9 
5 6 6 
6 7 2 
7 8 1 
Total 28 


FONTE: Os autores 


RA 


= 


A primeira coluna "i" representa apenas a linha da informação, a segunda coluna 
é a informação coletada e a terceira é a quantidade de vezes que a informação ocorreu: 
chamamos essa coluna de frequência absoluta e a representamos por f, Por exemplo, na 
1º linha (i = 1) temos que os alunos que tiraram nota 2 em estatística (x, = 2) foram 3 (f, = 3). 


Podemos dizer que a distribuição de frequência sem intervalo de classe 
é a simples condensação dos dados conforme as repetições de seus valores. Para 
um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já 
que exige muito espaço. 


Observe que a relação de dados que estamos usando é a mesma desde o 
início deste tópico. Iniciamos com os dados brutos, fizemos o ROL e agora a distribuição de 
frequência. 


3.2 DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE 
CLASSE 


Quando o tamanho da amostra é elevado, é mais racional efetuar o 
agrupamento dos valores em vários intervalos de classe. 


É importante que a distribuição conte com um número adequado de classes. 
Se o número de classes for escasso, os dados originais ficarão tão condensados 
que pouca informação se poderá extrair da tabela. Se, por outro lado, formarem- 
se muitas classes, haverá algumas com frequências nulas ou muito pequenas, 
e como resultado teremos uma distribuição irregular com pouca capacidade de 
interpretação do fenômeno como um todo. Por motivos práticos e estéticos, é 
bom que este número seja maior que cinco e menor que vinte. 


TABELA 29 - NOTAS EM ESTATÍSTICA - 2002 


Classes Frequências 
02 } 04 6 

04 } 06 13 

06 } 08 8 

08 [10 1 
Total 28 


FONTE: Os autores 


No exemplo anterior formamos apenas 4 intervalos de classes, pois 
não dispomos de dados suficientes para mais intervalos. Desta forma, caro/a 
acadêmico/a, não havia necessidade de montarmos uma distribuição de frequência 
com intervalos de classes para este pequeno número de dados, poderíamos fazer 
toda a descrição dos dados com a distribuição anterior, sem intervalos de classes. 


Contudo, há exemplos em que há a necessidade de agruparmos em 
classes. Veja a seguir dados sobre as idades dos participantes de uma excursão 
para visitar algum ponto turístico de Santa Catarina. 


12 13 15 15 15 15 16 17 18 19 
20 21 21 21 21 21 21 22 22 22 
32 33 33 33 33 33 33 50 50 50 
50 50 50 50 50 50 51 51 51 51 


51 51 51 51 52 52 52 52 52 52 


Os dados estão organizados em ordem crescente, portanto dizemos que 
estão em ROL. Porém, mesmo não sendo um número tão grande de dados, sua 
visualização e interpretação começam a ser difíceis. Organizando uma distribuição 
de frequência com intervalos de classes a apresentação ficaria assim: 


TABELA 30 — IDADES DOS TURISTAS 


Classes Frequências 
12} 19 9 

19 } 26 11 

26 } 33 

33 [40 6 

40 } 47 0 

47 } 54 23 
Total 50 


FONTE: Os autores 


l A 
RA 
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Alguns autores defendem a exclusão de uma linha, se a frequência for nula, 


como aconteceu no exemplo anterior (linha 5 classe 40 47). Nós não excluiremos! 


A construção correta de uma distribuição de frequência com classes segue 
algumas regras que veremos a seguir. Não se preocupe, que são regras fáceis. 


4 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 


Uma distribuição de frequência possui vários elementos, tais como: 


a) Classe: são os intervalos de variação da variável. E simbolizada por ie o 
número total de classes é simbolizado por k. 


Exemplos: 


No primeiro exemplo (Tabela 29): k = 4, pois foram formadas 4 classes de 
dados (4 linhas). A primeira classe, (i = 1) apresenta que os alunos que tiraram 
notas entre 2 e 4, excluindo o 4 (2 |-4) foram 6 (f, = 6). 


No segundo exemplo (Tabela 30): k = 6, ou seja, 6 classes (linhas) na 
distribuição de frequência. i = 4 representa a 4º classe, onde temos 33 } 40, ou seja, 
encontram-se os turistas de 33 até 40 anos de idade (excluindo os de 40). Nessa 
classe, f, = 6, ou seja, há 6 turistas nessa faixa etária. 


b) Limites de classe: são os extremos de cada classe. O menor número é o limite 
inferior de classe (1) e o maior número, o limite superior de classe (L,). 


Exemplos: no primeiro exemplo anterior, temos a classe 6 - 8, onde 1, 
=6eL=8.O símbolo - representa um intervalo fechado à esquerda e aberto à 
direita (ou seja, o valor 6 (1) pertence a essa classe enquanto que o valor 8 (L,) não 
Ep O dado 8 do ROL não pertence à classe 3 e, sim, à classe 4 representada 
por8 [-10. 


Já no segundo caso, temos a classe 33 - 40, onde], = 33 e L = 40. 


c) Amplitude do intervalo de classe: é obtida através da diferença entre o limite 
superior e inferior da classe e é simbolizada por h, = L, -1. 


Exemplo: no primeiro exemplo anterior h = 6 - 4 = 2. Obs.: Na distribuição 
de frequência com intervalo de classe o h, será igual em todas as classes. No 


segundo caso, temos h = 19 - 12 =7 (igual em todas as classes). 


d) Amplitude total da distribuição: é a diferença entre o limite superior da última 
classe e o limite inferior da primeira classe. AT = L(max) - I(min). 


Exemplo: no primeiro exemplo anterior AT = 10 - 2 = 8. No segundo caso, 
AT=54-12=42. 


e) Amplitude total da amostra (Rol): é a diferença entre o valor máximo e o valor 
mínimo da amostra (ROL), onde AA =X -X No primeiro exemplo anterior 
AA =8-2=6. No segundo caso, AA =52 — 12 = 40. 


Obs.: AT sempre será maior que AA. 


N7 


+ 


Caro/a acadêmico/a, perceba a sutil diferença entre a amplitude total da 
distribuição (AT) e a amplitude total da amostra (AA). Na primeira calcula-se a diferença do 


maior para o menor valor da distribuição NA TABELA, enquanto que, na segunda, calcula-se 
a diferença entre o maior e o menor valor da amostra, nos DADOS BRUTOS ou no ROL. 


f) Ponto médio da classe: é o ponto que divide o intervalo de classe em duas partes 


iguais. Ex.: no primeiro exemplo anterior, em 6 [- 8 o ponto médio x, = Se =, 


ou seja, x = Ea . No segundo caso, o ponto médio da 4º classe (33 } 40) será 


4.1 METODO PRÁTICO PARA CONSTRUÇÃO DE UMA 
DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE 
CLASE 


- Organize os dados brutos em um ROL. 


ta 
Io 


2º - Calcule a amplitude amostral AA. 


No 


e - Calcule o número de classes através da “Regra de Sturges”: i= 1 + 3,3.log n 
onde: i = o número de classes da distribuição de frequência; Log n = logaritmo 
do número de elementos envolvidos. 


Obs.: é necessária uma calculadora científica para determinar o logaritmo 
de um número. Primeiro descubra o log n, depois multiplique por 3,3 e, por 
último, some 1. 


Caro/a acadêmico/a, qualquer regra para determinação do nº de classes da 


tabela não nos leva a uma decisão final. O número de classes, na realidade, vai depender de 
um julgamento pessoal, que deve estar ligado à natureza dos dados. Por exemplo, quando se 
está trabalhando com notas de alunos (de zero a dez), a regra perde o seu verdadeiro objetivo, 
mesmo porque normalmente se trabalha com amostraas superiores a cem elementos. Neste 
caso, aplicando a regra de Sturges para uma amostra de 1200 elementos, encontrar-se-iam 
11 classes, o que se toma inviável. 


4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe 
h> AA 


1 
Obs.: o símbolo > significa maior que, ou seja, que h é maior que a razão entre 
AA (amplitude total da amostra) e i (número de classes). 


5º - Temos então o menor nº possível para a amostra, o nº de classes e a amplitude 
do intervalo. 


Exemplos de construção de uma tabela de distribuição de frequência de 
classes: 


Exemplo 1: Uma prefeitura coletou dados sobre a renda mensal dos 
indivíduos de uma comunidade para traçar um perfil socioeconômico e a partir 
disso elaborar um projeto social na comunidade. A seguir está o resultado de 
uma amostra aleatória de 50 pessoas residentes na comunidade: 


899,76 578,90 800,00 1234,32 2080,00 
786,43 1010,43 1654,25 908,99 990,54 
1000,76 1100,45 1600,00 1345,54 965,00 
1900,00 980,12 1055,90 777,23 880,76 
1670,98 2000,00 1865,43 1408,30 671,45 
678,12 1785,30 1100,00 2043,89 1009,65 
920,98 1029,12 1900,43 1290,12 976,45 
1080,67 850,80 2109,88 885,85 683,92 
595,45 900,00 1920,01 1280,70 904,90 
1798,24 1000,00 1383,90 1782,39 1100,99 


Para escrever esses dados numa tabela de distribuição de frequência de 
classe faremos os 5 passos: 


1° passo: fazer o ROL. 


Basta colocar os dados anteriores em sequência crescente: 


578,90 885,85 1000 1234,32 1785,3 

595,45 899,76 1000,76 1280,70 1798,24 
671,45 900,00 1009,65 1290,12 1865,43 
678,12 904,90 1010,43 1345,54 1900,00 
683,92 908,99 1029,12 1383,90 1900,43 
777,23 920,98 1055,90 1408,30 1920,01 
786,43 965,00 1080,67 1600,00 2000,00 
800,00 976,45 1100,00 1654,25 2043,89 
850,80 980,12 1100,45 1670,98 2080,00 


880,76 990,54 1100,99 1782,39 2109,88 


2º Passo: calcular a amplitude amostral: AA =x ax T Xmin 


Basta fazer a diferença entre o maior e o menor salário obtido na pesquisa: 
AA =X a Xmin = 2109,88 - 578,90 = 1530,98 


3º Passo: calcular o número de classes através da “Regra de Sturges”: i = 1 + 3,3. 
log n 


Então será i = 1 + 3,3.log(50) 
i=1+3,3.1,70 
i=1+5,61 
i=6,61 


Para calcular o log n pela calculadora HP12C acesse a Trilha e Aprendizagem e 
leia o tutorial que disponilizamos para você. 


4º Passo: calcular então a amplitude do intervalo de classe h > aa ; 
i 


| AA _ 1530,98 
i 6,61 


h = 231,73 


Por opção do pesquisador, vamos arredondar h para um número inteiro: 
h = 232,00. 


| a 
Aa 


= 


Apesar de termos arredondado para um número inteiro, geralmente usamos a 
quantidade de casas decimais apresentadas nos dados do ROL. Nesse exemplo seriam duas 


casas decimais. Porém o pesquisador pode alterar essa quantidade quando achar necessário. 
Nos exercícios posteriores, daremos a resposta usando arredondamento com a mesma 
quantidade de casas decimais apresentadas nos dados do ROL. 


5º Passo: construir a tabela. 


Para isso começamos com o menor valor de salário (578,90) e depois 
vamos somando o h = 232,00, formando várias classes até que uma classe englobe 
o valor do maior salário (2109,88). 


Veja: 


TABELA 31 - SALÁRIOS DOS MORADORES DA COMUNIDADE 


I Classes Frequências 

1 578,90 } 810,90 8 

2 810,90 | 1042,90 17 

3 1042,90 | 1274,90 6 

4 1274,90 }1506,90 5 

5 1506,90 }1738,90 3 

6 1738,90 }1970,90 7 

7 1970,90 }2202,90 4 
Total 50 

FONTE: Os autores 


Para chegar aos valores das frequências da tabela anterior, basta contar 
quantos salários estão entre os limites inferiores (1) e os limites superiores (L). 
Na classe 1, por exemplo, temos que contar quantos estão no intervalo [578,90; 
810,90). Olhando no ROL temos os seguintes salários nesse intervalo: 578,90; 
595,45; 671,45; 678,12; 683,92; 777,23; 786,43 e 800,00 que totalizam 8, que é o 
número da frequência da classe em questão. Nas próximas linhas e outras tabelas 
se age da mesma forma. 


Construa essa tabela em uma folha para verificar se você entendeu os passos. 
Após essa construção, passe para os exercicios. 


RESUMO DO TÓPICO | 


Neste tópico você estudou que: 


A organização dos dados em tabelas é chamada distribuição de frequência. 
Os dados na forma como foram coletados são chamados dados brutos. 


A ordenação dos dados brutos em forma crescente ou decrescente é chamada 
rol. 


Uma distribuição de frequência pode ser feita com ou sem intervalos de classes. 
Para determinar a quantidade de intervalos de classes usamos a Regra de 


Sturges: 
i=1+3,3.logn. 
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AUTOATIVIDADE 


Para saber se você realmente entendeu o que estudamos neste tópico, 
faça as atividades propostas a seguir: 


1 Os dados a seguir são referentes a vendas diárias de ventiladores, durante 
três meses do ano, em uma grande rede de lojas. 


19 10 9 15 12 19 11 10 12 14 
2 16 10 13 12 15 11 12 12 13 
14 11 12 12 14 15 14 12 15 12 
12 12 14 15 11 14 14 15 13 12 
14 6 16 14 12 12 15 15 14 11 
14 14 12 11 15 12 15 17 11 14 
12 13 11 14 12 11 14 10 11 13 
11 10 13 13 14 13 14 11 11 11 
9 17 18 13 12 16 10 2 9 9 


Os dados apresentados na tabela acima são dados brutos. 


a) Organize-os em rol. 

b) Qual a amplitude amostral? 

c) Organize os dados em uma distribuição de frequência sem intervalos de 
classes. 

d) Obedecendo aos passos para construir uma distribuição de frequência com 
intervalos de classes: 
i. calcule quantas classes devem ser formadas através da Regra de Sturges; 
ii. calcule o intervalo das classes; 
iii. construa a distribuição de frequência. 

e) Qual é a amplitude total da distribuição com intervalos de classes? 

f) Qual é o limite inferior da segunda classe? 

g) Qual é o limite superior da distribuição? Esse limite é um valor que está na 
amostra? Qual o motivo fez surgir esse limite superior? 


2 Temos, a seguir, os pesos (em gramas) de 50 ratos usados em um estudo 
de deficiência de vitaminas. Agrupe estes pesos em uma distribuição de 
frequência, segundo a regra de Sturges. 


136 92 115 118 121 137 132 120 104 125 
119 101 129 87 108 110 133 135 126 127 
115 103 110 126 118 82 104 137 120 95 
146 126 119 119 105 132 126 118 100 113 
106 125 117 102 146 129 124 113 95 148 


3 A seguir, a tabela apresenta uma distribuição de frequência das áreas de 400 
lotes de terreno urbano: 


TABELA 32 — TAMANHO DOS LOTES DA CIDADE DE PAULO LOPES/ 


SC - 2005 
i | ÁREAS (m) | NºDELOTES 
1 | 300 } 400 14 
2 | 400 } 500 46 
3 500 } 600 58 
4 600 [700 76 
5 700 } 800 68 
6 | 800 } 900 62 
7 | 900 [1000 48 
8 | 1000 } 1100 22 
9 | 1100 } 1200 6 
FONTE: Os autores 


Em relação à tabela anterior, determine: 

a) a amplitude total; 

b) o limite superior da quinta classe; 

c) o limite inferior da oitava classe; 

d) o ponto médio da sétima classe; 

e) a amplitude do intervalo da segunda classe; 

f) a frequência da quarta classe; 

g) o número de lotes cuja área não atinge 700 m?; 

h) o número de lotes cuja área atinge e ultrapassa 800 m?; 

i) a porcentagem dos lotes cuja área não atinge 600 m?; 

j) a porcentagem dos lotes cuja área seja maior ou igual a 900 m?; 
k) a porcentagem dos lotes cuja área é de 500 m?, no mínimo, mas inferior a 1000 m?; 
D a classe do 72º lote; 

m) até que classe estão incluídos 60% dos lotes? 


4 Um administrador está acompanhando a cotação de uma ação no primeiro 
trimestre do corrente ano. Os resultados obtidos estão apresentados a seguir. 
Faça uma tabela de classes usando a regra de Sturges. 


24,08 27,97 2407 26,63 22,14 26,95 26,34 26,58 24,68 
24,00 26,87 25,67 23,41 22,95 22,69 23,74 25,77 23,71 
24,90 25,24 25,02 27,30 23,70 28,00 24,36 27,91 23,28 
22,90 25,00 22,78 25,24 23,68 24,66 26,79 28,00 24,43 
24,96 27,29 23,78 25,98 22,26 26,49 27,32 24,23 26,47 
23,83 2711 25,07 26,26 26,95 24,69 24,42 25,24 27,13 
25,05 27,68 22,36 26,45 27,85 27,07 28,00 24,35 25,98 
24,60 25,14 2714 26,06 27,06 23,32 24,67 25,39 24,31 
23,89 24,12 24,64 26,45 24,31 22,56 24,94 25,37 24,78 
23,45 27,48 22,27 25,51 22,55 26,68 24,69 22,47 24,73 


TÓPICO 2 


REPRESENTAÇÕES GRÁFICAS DAS DISTRIBUIÇÕES DE 
FREQUÊNCIA 


| INTRODUÇÃO 


Os gráficos de análise são os mais adequados para as informações 
estatísticas, pois além de serem informativos, fornecem elementos úteis à análise 
de dados. Ao fazer um gráfico para apresentar uma análise de dados, este 
frequentemente estará acompanhado pela respectiva tabela de dados, além de 
um texto dissertativo chamando a atenção do leitor para o ponto, ou os pontos 
principais da tabela e do gráfico. Muitos relatórios administrativos, econômicos, 
ou de outra natureza qualquer, são elaborados desta forma. Os histogramas, 
polígonos de frequência e curvas de frequência são gráficos de análise. 


Na maioria das vezes, os gráficos são construídos para facilitar a 
interpretação do leitor, principalmente o leigo em Estatística. As informações 
mais relevantes, para o estatístico, estão nas tabelas e é com elas que se faz a 
análise de dados, tiram-se conclusões e pode-se chegar à tomada de decisões. 


2 TIPOS DE GRÁFICOS DE UMA DISTRIBUIÇÃO DE 
FREQUÊNCIA 


Os gráficos mais frequentes e mais utilizados para representar uma 
distribuição de frequência são: o Histograma, o Polígono de Frequência e o 
Polígono de Frequência Acumulada. 


Histograma: os histogramas são formados por um conjunto de retângulos, 
com as bases sobre o eixo x, sendo o centro de cada retângulo o ponto médio da 
classe por ele representada. A altura de cada retângulo ou coluna é proporcional 
à frequência da classe. A área de cada retângulo, portanto, é proporcional 
à frequência da classe que ele representa. Assim sendo, a soma dos valores 
correspondentes às áreas dos retângulos é igual à frequência total. 


O histograma apresenta graficamente os dados organizados numa tabela 
de distribuição de frequência. Isto é, dados contínuos. Para tanto precisamos: 


1. traçar o sistema de coordenadas; 


2. encontrar o ponto médio do intervalo de classe; 


3. desenhar as colunas de tal forma que seu centro seja o ponto médio da 
amplitude do intervalo. 


Exemplo: 


TABELA 33 — ALTURAS DOS ALUNOS DA TURMA A - 2004 
Classe de altura Altura (cm) f, Nº Estudantes 
A 150 [158 5 
B 158 [166 18 
C 166 } 174 42 
D 174 } 182 27 
E 182 } 190 8 


FONTE: Os autores 


Para construir o histograma do exemplo anterior seguimos o seguinte: 
1° Eixo x (horizontal): no eixo x colocaremos os limites das classes, no 


caso, 150, 158, 166, 174, 182 e 190, espaçadas igualmente. 


150 158 166 174 182 190 


r 


2º Eixo y (vertical): introduzimos um eixo vertical (eixo y) que representará 
a frequência de cada classe. Para isso olhamos sempre a maior frequência (no 
caso 42). Então escrevemos alguns valores numéricos no eixo y, sempre com o 
mesmo espaçamento entre os valores, de forma a chegar até a maior frequência. 
O único cuidado que temos que tomar é para o eixo y não ficar muito grande, seu 
tamanho deve ter aproximadamente 2/3 do tamanho do eixo x. Para garantir esse 
tamanho, basta arranjar um espaçamento entre os números que seja suficiente. 
No nosso caso utilizaremos espaçamento de 5 unidades. 


150 158 166 174 182 190 


TÓPICO 2 | REPRESENTAÇÕES GRÁFICAS DAS DISTRIBUIÇÕES DE FREQUÊNCIA 
Após os eixos estarem prontos, basta fazer colunas em cada intervalo de 


classe correspondente. A altura da coluna será relativa ao número da frequência 
na classe em questão. 


Chegamos finalmente ao gráfico: 


GRÁFICO 7 — ALTURAS DOS ALUNOS DA TURMA A DE 2004 


FONTE: Os autores 


a) 


Cuidado: esse gráfico parece um gráfico de coluna, mas não é, e nem pode ser 
chamado assim. Nesse gráfico, as “colunas” estão juntas porque todas as frequências estão 
em continuidade. 
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RESUMO DO TÓPICO 2 


Neste tópico você estudou que: 


e O gráfico indicado para apresentar dados de uma distribuição de frequência 
com intervalos de classe é o histograma. 


e O histograma é um conjunto de colunas justapostas: uma inicia onde termina a 
outra. 
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AUTOATIVIDADE 


Resolva as seguintes autoatividades para fixar este assunto: 


1 Numa universidade foi feito um levantamento das idades dos estudantes em 
diversas classes. O resultado desta pesquisa está na tabela a seguir: 


TABELA 34 — IDADE DOS ALUNOS DA TURMA M - 2009 


Classe (|) Idade (anos) Nº Estudantes( f, ) 
1 15 +20 5 
2 20 }25 28 
3 25 30 36 
4 30 [35 17 
5 35 }40 8 


FONTE: Dados fictícios 


Construa o histograma referente à tabela anterior. 


2 Raquel fez uma pesquisa para a disciplina de Estatística sobre quantas horas 
os colegas estudavam por dia. Obteve o histograma a seguir. 


GRÁFICO 8 — HORAS DIÁRIAS DEDICADAS AO ESTUDO - COLÉGIO X - 2009 


= 
© 


DO EEEE 


9 
8 
az 
E 6 
35 
A 
A 
2 
1 
0 


4}6 6ts sfio 10f12 12/14 
Nº de horas 


FONTE: Os autores 


Observando o histograma (Gráfico 8), responda: 


a) Quantas classes Raquel formou? 

b) Quantos colegas Raquel entrevistou? 

c) Qual a amplitude de cada classe? 

d) Em que intervalo se encontra a resposta de maior frequência? 
e) Quantos colegas de Raquel estudam entre 4 e 6 horas por dia? 
f) Qual a porcentagem de alunos que estuda no máximo 6 horas? 
g) Há alunos que estudam mais do que meio dia? 


JUNDADE 2 | TÓPICO 3 


MEDIDAS DE POSIÇÃO - TENDÊNCIA CENTRAL 


| INTRODUÇÃO 


O estudo de distribuição de frequência, até agora, permite descrever os 
grupos dos valores que uma variável pode assumir. Desta forma, podem ser 
localizados onde ocorre maior concentração de valores de uma dada distribuição, 
isto é, se ela se localiza no início, no meio ou no final, ou ainda, se há uma 
distribuição normal. 


Para ressaltar as tendências características de cada distribuição, 
isoladamente, ou em confronto com outras, é necessário introduzir conceitos que 
se expressem através de números, que permitam traduzir estas tendências. Estes 
conceitos são denominados elementos típicos da distribuição e são: medidas de 
posição; medidas de dispersão; medidas de assimetria; medidas de curtose. 


As medidas de posição representam uma série de dados, orientando 
quanto à posição da distribuição em relação ao eixo horizontal. 


Dentre as várias medidas de posição, descreveremos a seguir, a média, a 
moda, a mediana e os quartis 1 e 3. E importante você notar que sempre há três 
formas de calcular essas medidas, dependendo de como os dados se encontram: 
quando eles não estão agrupados, agrupados em frequência simples e agrupados 
em classes. Apresentaremos os cálculos das três formas, preste atenção para você 
não se confundir. 


2 MÉDIA ARITMÉTICA (X) 


2.1 DADOS NÃO AGRUPADOS 


A medida mais popular de tendência central é a média aritmética, ou 
simplesmente média. A média aritmética de n números é a sua soma dividida por 
n. Exemplo: um gerente de um supermercado, que deseja estudar a movimentação 
de pessoas em seu estabelecimento, constata que entraram em sua loja nos últimos 
5 dias 295, 1002, 941, 768 e 1283 pessoas. Descubra o número médio de pessoas 
que entraram no estabelecimento nesses cinco dias. Ou seja: 


295 + 1002 + 941 +768 + 1283 
5 


X= = 858 pessoas 


Observe agora outra situação em que precisamos calcular a média. 


Suponha que estamos interessados na vida média de um lote de 40 mil 


lâmpadas. E óbvio que não podemos testar todas as lâmpadas, porque não 
sobraria nenhuma depois do teste. 


Tomamos então uma amostra, calculamos sua média e com este valor 
estimamos a média populacional (u). 


Se n=5 e as lâmpadas da amostra duram: 967, 949, 940, 952 e 922 horas, 


temos: X = POA = + 202 + da = 946h, desta forma podemos estimar uma 


média de 946 horas de vida para as 40 mil lâmpadas. E escrevemos: u = 946h. 


a 


N7 


O parágrafo anterior deu uma diferença entre média populacional e amostral. 


A amostral ( X Jestima, ou seja, dá uma aproximação, da média populacional (u), que seria a 
média calculada com todos os indivíduos. 


O procedimento anterior nos permite calcular a média, quando os dados 
não estão agrupados. Mas, como proceder quando os dados estiverem agrupados 
numa distribuição simples? 


2.2 DADOS AGRUPADOS EM DISTRIBUIÇÃO DE FREQUÊNCIA 
SIMPLES 


Observe a distribuição: 


TABELA 35 - DISTRIBUIÇÃO DE FREQUÊNCIA 


Classe (,) Dados Frequência (f,) 
1 1 2 
2 3 4 
3 9 2 
4 15 3 
5 27 1 


FONTE: Os autores 


Para encontrar a média, multiplicamos a variável (dados) pela frequência 
(f£), somamos todos os produtos e dividimos o resultado pela quantidade de dados: 


1.2+3.4+9.2+15-3+27.1 2+12+18+45+27 104 
12 12 12 


X= 


=8,67 


Um outro exemplo, consideremos a seguinte tabela: 


TABELA 36 - DISTRIBUIÇÃO DE FREQUÊNCIA 


Classe (,) Frequência (f,) 
1 6 
2 4 
3 1 
4 1 
5 1 
K=5 Total 13 


FONTE: Os autores 


x Sbt E 6,4 


2.3 DADOS AGRUPADOS EM DISTRIBUIÇÕES COM 
INTERVALOS DE CLASSES 


Quando os dados estiverem agrupados em intervalos de classe, usamos a 
fórmula a seguir para calcular a média: 


O símbolo X é uma letra grega chamada sigma e simboliza a soma de todos os 
valores de x - fe f, 


Para calcularmos a média, referente a dados agrupados em frequência de 
classe, vamos aprender a “preparar” a nossa tabela a partir das colunas iniciais 
construídas, como explicado no Tópico 1. 


Ponto Médio 


i Classes fı Xı X cf 
1 100 } 200 15 
2 200 } 300 19 
3 300 } 400 16 
Totais 50 


O ponto médio (x) é o valor médio entre o limite inferior (1) e o limite superior 
Lt, | 
2 


(L) de cada classe, ou seja, x, = 


i Classes fi Xi Xi. fi 


1| 100 É200 |15 


2 | 200 }300 
3 | 300 }400 


Totais 


300 + 400 


100 + 200 
o 2 


2 


+ 


A coluna x f, será dada multiplicando o valor da coluna f, pelo valor da coluna x. 


i Classes fi Xi Xi. fi (x; — X). fi 
1| 100 F200 |15 | 150 | 22505 
2 | 200 }300 | 19 | 250/ (4750) 


3| 300 }400 | 16 | 350 600) 


Totais 50 - 12600 X 
19.250 


Agora, temos os dados necessários para calcular a média: 


n 
B -fı ———> | Soma da coluna xı fa 
i=1 


x= 


>I ——+ | Soma da coluna fı 


No nosso exemplo ficará: 


x = 12600 _ a59 
50 


Note que pegamos a soma da coluna x,f, e a dividimos pela soma da 
coluna f. 


Vamos ver outros exemplos de cálculo de média. 


Exemplo: calcule a média aritmética do seguinte conjunto de dados: 


TABELA 37 - CONJUNTO DE DADOS ALEATÓRIOS 


i Classes f 
1 1+3 
2 3 5 
3 5 }7 
4 
5 


7 }9 
9 H11 


N A © A N 


Totais 20 


FONTE: Os autores 


Completamos a tabela: 


i Classes Í. X, xf, 
2 4 
1f 1-3 [2/4 | 16 
2/ 3h-5 [4 | 6 | 48 
3) 5-7 |88| 32 
4| 7h9 [4|10| 20 
5| 9t11 2 
Totais 20 120 


Calculamos a média: 


2 ——— > | Soma da coluna xy'fi (120) 


X= X =120=6 


bo f; ——» | Soma da coluna fı (20) 


Veja algumas vantagens da média aritmética: 
1. É fácil de se calcular. 
2. De seu cálculo participam todos os valores da série. 
3. Admite tratamento algébrico. Se tivermos as médias de dois ou mais subconjuntos e o 
número de elementos de cada um deles, poderemos determinar a média do conjunto. 


Agora atente para algumas desvantagens da média aritmética: 
1. Está muito sujeita aos valores extremos, tendendo a se aproximar deles. 
2. Só pode, a rigor, ser usada nas distribuições simétricas. 


Caro/a acadêmico/a, vamos voltar ao caso das lâmpadas. Tínhamos uma 
amostra de 5 lâmpadas com a durabilidade de 967, 949, 940, 952 e 922 horas. 
Suponha que o segundo valor seja registrado incorretamente como 499, em lugar 
de 949. Vamos verificar como seria agora a nova média: 


967 + 499 +940 +952 +922 4280 
5 


X= - 856h 


Veja que a média anterior, ou seja, a média correta era 946h. Um só valor 
extremo diminuiu o valor da média em quase 10%. 


Veja mais um exemplo que mostra como a média está sujeita aos valores 
extremos: 


As idades de seis alunos, que participaram de uma excursão com 
finalidade ecológica, são 18, 19, 20, 17, 19, 18. A idade do instrutor que foi com 
eles é 50. Vamos determinar a média das sete pessoas. 


18+19+20+17+19+18+50 + 
7 


X= 23 


Mas, essa informação de que a idade média do grupo é de 23 anos não 
fecha com a realidade. Então, em situações como estas que acabamos de mostrar, 
o mais correto é fazer uso da mediana ou moda, que veremos aseguir. 


3 MODA (M,) 


É o valor da variável ou observação com maior frequência, isto é, a variável 
que ocorre mais vezes. Às vezes, num conjunto de dados podemos, ou não, ter 
moda. Não existindo moda, ele será amodal; havendo mais de uma moda ele será 
multimodal — bimodal para duas modas, trimodal para três modas. 


Novamente, vamos separar o estudo do cálculo da moda nas três 
apresentações dos dados vistos. 


3.1 DADOS NÃO AGRUPADOS 


Basta colocar os valores no ROL e depois verificar qual valor ocorreu com 
maior frequência. Esse valor será a moda da distribuição. 


| aê 
RA 


+ 


| Podem existir várias modas numa mesma distribuição. | 


3.2 DADOS AGRUPADOS EM FREQUÊNCIA SIMPLES 


A moda será o valor com maior frequência, ou seja, basta olhar a linha em 
que f é maior. Veja a tabela a seguir como exemplo. 


Classe (,) Dados Frequência ( f, ) 
1 1 2 
2 3 4 
3 9 2 
4 15 3 
5 27 1 
K=5 Total 12 


A moda desta distribuição representada na tabela anterior é o valor 3 
(coluna Dados), porque tem a maior frequência (f). Podemos também dizer que 
3 é a moda da distribuição porque ocorre 4 vezes, sendo essa a maior frequência 
nessa distribuição. 


3.3 DADOS AGRUPADOS EM CLASSE 


Quando os dados estiverem agrupados em intervalos de classe, encontra- 
se a classe modal e calcula-se a moda pelo seguinte modelo matemático: 


onde: d, = diferença entre a frequência da classe modal e a anterior; 
d = diferença entre a frequência da classe modal e a posterior; 


l = limite inferior da classe modal; 
h= amplitude da classe modal (L, —1). 


Vamos calcular a moda para o seguinte conjunto de dados agrupados em 
intervalos de classes: 


1º Passo: identificar a classe onde a moda se encontra (Classe Modal): 


TABELA 38 - CONJUNTO DE DADOS ALEATÓRIOS 


i Classes f, X; Fa, 

1 1+3 2 2 2 

2 3 F5 4 4 6 

3 5 -7 8 6 14 

4 7 }9 3 8 18 

5 9 F11 3 10 20 
Totais 20 


FONTE: Dados fictícios 


A classe modal é a terceira classe (i,) da distribuição, pois é ali que se 
encontra a maior frequência, que é 8. 


2º Passo: definida a classe modal, vamos aplicar a fórmula para o cálculo 
da moda: 


M, =; + h h, 
di +d, 


sendo: d, = maior f, menos f, anterior (f, - f, = 8 - 4 = 4); 
d, = maior f, menos f, posterior (f, - f, =8 -3 = 5). 


Não se esqueça do que significa l (limite inferior da classe) e h, (amplitude da 
classe). Caso não lembre, retome ao estudo dos tópicos anteriores. 


M,=1,+ & i 
á d, +d, 
M getoa 
È 4+5 


Men p i 
9 9 


Encontramos então o valor da moda, que é 5,8. 


Outro exemplo, para entender bem. Lembre-se: primeiro determine a 
classe modal (linha com maior frequência), somente após isso é que aplicamos a 
fórmula da moda. 


a A UNA 


Totais 51 


Essa tabela não está com todas as colunas calculadas, mas não precisamos 
delas. 


1º Passo: a classe modal é a 3º classe (15 | 20), pois possui a maior 
frequência (f, = 17). 


2º Passo: definida a classe modal, vamos aplicar a fórmula para o cálculo 
da moda: 


Hi h, 
d +d, ' 


M =£4.+ 


0 1 


sendo: d, = maior f, menos f, anterior (17 - 11 = 6); 
d, = maior f, menos f, posterior (17 - 9 = 8). 


(17-11) 


M,=15+ . 
° (17 -11)+(17 -9) 
Mei 6 
6+8 


M eo asr seia 
: 14 14 


Encontramos então o valor da moda que é 17,14. 


4 MEDIANA (Ma) 


Outro conceito para a tendência central é a mediana. Mostraremos como 
definir a mediana a seguir para as três formas de organizar uma distribuição. 


4.1 DADOS NÃO AGRUPADOS 


Quando todas as observações estão ordenadas (em rol), a mediana é o 
valor da observação central. A mediana não é calculada como a média. Ao invés 
disso, para determinar a mediana, calculamos a sua posição, o valor que estiver 
naquela posição será a mediana. 


, . n+1 3 
Para o cálculo da mediana fazemos: , sendo n o número de dados da 


distribuição. 2 


Quando o número de dados é par, a posição será um valor “quebrado”, 
com isso a mediana é a média dos dois dados centrais. 


Exemplo 1: Qual a mediana dos dados a seguir? 
4 7 8 


1º maneira — intuitivamente: a mediana é o termo que se encontra no 
centro da distribuição e, nesse caso, é o 7. 


2º maneira — usando as fórmulas: primeiramente calculamos a posição da 
3+1 4 


mediana usando n+l, Como temos 3 dados, então n = 3. Assim ra =2 . Ou 
2 
seja, a mediana é o dado da 2° posição, logo Md =7. 


Exemplo 2: Qual a mediana dos dados a seguir? 
3 5 9 16 


1º maneira — intuitivamente: perceba que não há um valor no centro da 
distribuição e, sim, dois valores (5 e 9). A mediana será, então, a média desses 


valores: so = a =7 
2 2 


2º maneira — usando as fórmulas: temos 4 dados, então n = 4. Assim, 


nt] 4+1 5 


=—=2,5 que representa a posição entre o 2° e o 3º dado, que não 
2 2 2 


existe. Nesse caso, calculamos a média entre o 2º (5) e o 3º (9), que é 7. 


Exemplo 3: Seja o seguinte ROL: 


578,90 885,85 1000 1234,32 1785,3 

595,45 899,76 1000,76 1280,70 1798,24 
671,45 900,00 1009,65 1290,12 1865,43 
678,12 904,90 1010,43 1345,54 1900,00 
683,92 908,99 1029,12 1383,90 1900,43 
777,23 920,98 1055,90 1408,30 1920,01 
786,43 965,00 1080,67 1600,00 2000,00 
800,00 976,45 1100,00 1654,25 2043,89 
850,80 980,12 1100,45 1670,98 2080,00 
880,76 990,54 1100,99 1782,39 2109,88 


1º Passo: calcule a posição da mediana: 


a A E 
2 2 


posição : 


2º Passo: determine o valor da mediana. 


Como a posição 25,5 não existe, temos que pegar os valores da posição 25 
e da posição 26; depois disso fazer a média entre os dois valores (sempre que o 
número de dados n for par acontecerá isso). 


Posição 25: x,,= 1029,12 Posição 26: x,.= 1055,90 


A mediana será a média dos dois valores encontrados, ou seja 


Ma = 1022-12 + 1055,90 _ 1042,51. 


Para determinar os valores das posições calculadas, colocamos os valores em 
ROL e contamos até a posição desejada. Volte na tabela anterior e conte, na ordem em que 
os dados crescem, até a posição 25 e 26 e perceba que são os valores 1029,12 e 1055,90. 


Se o número de dados n for ímpar, o cálculo da posição dará um número 
inteiro, com isso bastará encontrar o valor no ROL que está na posição calculada. 
Como teremos apenas um valor, esse valor será a mediana. 


4.2 FREQUÊNCIA SIMPLES 


Observe com atenção a construção da tabela. Nossos dados agora estão 
agrupados. 


TABELA 39 - NÚMERO DE FILHOS DAS FAMÍLIAS NO AMAPÁ - 2000 

i X f, Fa, 

1 0 2 2 

2 1 7 (OPA 

3 2 21 GO—{ 9421 | 

4 3 18 30+18 

5 4 9 (57)—»| 48+9 

6 5 4 57+4 

Total 61 


FONTE: Os autores 


A frequência acumulada é obtida somando a linha da frequência (f) com todas 
as linhas anteriores da frequência f, 


Os dados estão agrupados em frequência simples; o jeito de determinar 
a mediana é bem fácil, novamente temos que calcular a posição para depois 
determinar a mediana. 


1º passo: posição: = = Lan = se =31 


2 2 


Logo, queremos o valor da posição 31, em outras palavras, o valor x, . 
2º passo: determine o valor da mediana. 


Para isso, temos que olhar a coluna da frequência acumulada (Fa) e 
encontrar a linha do primeiro valor maior que a posição calculada, que, no nosso 
caso, é 31. 


Na tabela o primeiro valor da coluna Fa (maior que 31) é 48, que está na 
linha 4. Logo, o valor da mediana é 3, porque é o x, da linha 4, ou seja, Md = 3. 


Você pode observar que, como estamos procurando o valor que ocupa a 
31º posição (x,,), não faria sentido procurar nas 3 primeiras classes, pois até a 1º 
classe temos apenas 2 valores (x, e x,); na 2º classe temos 7 valores (de x, a x,); na 
3º classe temos 21 valores (de x, a x,). Apenas na 4º classe (i = 4) é que vamos 
encontrar o valor de x, que procuramos (x, = 3). 


OBSERVAÇÃO: se o número de dados n for par, acontecerá novamente 
uma posição intermediária. Se essa posição ficar entre duas linhas, tira-se a média 
entre os dois valores das respectivas linhas, caso contrário, a mediana será o valor 
da linha, como no caso de n ímpar mostrado anteriormente. 


4.3 DADOS AGRUPADOS 


Caro/a acadêmico/a, veja agora como proceder para determinar a mediana 
quando os dados estão agrupados em intervalos de classes: 


TABELA 40 - PONTUAÇÃO AFERIDA PELAS EQUIPES NO CAMPEONATO DE 
VOLEIBOL - 2006 


i Pontos f, X Fa, 

1 1+3 2 2 

2 3 -5 4 4 

3 5 -7 8 6 14 

4 7 }9 4 8 18 

5 9 }11 2 10 20 
Total 20 


FONTE: Os autores 


1º Passo: determine a posição em que a mediana se encontra, igual aos 
casos anteriores. 


Posição: 


+1 
n+1 2f DD A ane 
2 2 2 q 


2º Passo: determine a classe da mediana, que nada mais é que a linha em 
que a posição calculada (no caso 10,5) se encontra. Novamente, para determinar 
essa linha (classe), basta olhar a coluna da frequência acumulada (Fa). O primeiro 
valor dessa coluna Fa maior que a posição calculada indicará a classe da mediana. 


No nosso exemplo, o primeiro valor maior que 10,5 é o 14, que está na 3º 
classe (linha 3), ou seja, a classe da mediana será 5 H 7. 


TABELA 41 - PONTUAÇÃO AFERIDA PELAS EQUIPES NO 
CAMPEONATO DE VOLEIBOL - 2006 


i Pontos f, X, Fa, 
1 1 L 3 2 2 2 1º valor 
maior que 

2 3 H5 4 4 6 P 10,5 
moana O 
mediana 

> 
4 7 }9 4 8 18 
5 9 }11 2 10 20 
Total 20 


FONTE: Os autores 


3º Passo: calcule a mediana usando: 


(anterior) |.h, 


f 


Md=I, + 


onde: /,= limite inferior da classe da mediana 
Fa, (anterior) = frequência acumulada da classe anterior à da mediana 
[J.= frequência da classe mediana 


h,= amplitude da classe modal 


i=3 
L,=5 
X f, =20 
Fa, (anterior) =6 


f,=8 


com 


h, =2 
[2-62 
2 
Md=5+=——=— 
8 
Ma = 54 £02612 
E 
8 
Md=5+É 
8 
Md=5+1 
Logo: Md = 6 


OBSERVAÇÃO: Apesar de o resultado da mediana do nosso exemplo ter 
dado um número inteiro, ou também pode ser decimal, sem problemas. 


A escolha da medida de tendência central para a pesquisa que está sendo realizada 
depende, em princípio, dos objetivos da pesquisa, pois, enquanto a média é influenciada pelos 


valores extremos, a moda e a mediana não são afetadas por tais valores. Por isso a medida 
deve ser escolhida pelo usuário considerando seus estudos e seus objetivos. Nem sempre 
as três medidas podem ser aplicadas. Sempre que possível, utilizamos as três medidas, ou 
duas delas, pois elas se complementam. Essa é uma lição que você deve levar desse tópico: 
nenhuma medida é completa, todas dão informações importantes sobre a distribuição e só 
ficam completas quando analisamos todas as medidas possíveis. 


RESUMO DO TÓPICO 3 


Neste tópico você estudou que: 


As medidas de tendência central tendem a agrupar os dados em torno dos 
valores centrais. Dentre as medidas de tendência central, destacam-se: média, 
mediana e moda. 


A média aritmética de n números é a sua soma dividida por n. 


Para encontrar a média, quando os dados estão agrupados, multiplicamos a 
variável (dados) pela frequência, somamos todos os produtos e os dividimos 
pela quantidade de dados. 


A média dos dados agrupados em intervalos de classe é obtida pela fórmula: 


A moda é o dado que ocorre com maior frequência. 


r 


A moda dos dados agrupados em intervalos de classe é obtida usando a 
fórmula: 


A mediana é o dado que se encontra no centro dos dados. 


A mediana dos dados agrupados em intervalos de classe é obtida usando a 


fórmula: 
Z = fon þa, 


Ea 
J 


Md=l; + 


15 


AUTOATIVIDADE 


Resolva os seguintes exercícios para aprofundar seus conhecimentos: 


1 Uma cidade turística tem 32 hotéis de três estrelas. Pretende-se conhecer o 
custo médio da diária para apartamento de casal. Um levantamento mostrou 
os seguintes preços de diárias (em reais): 100, 80, 135, 90, 95, 90, 100, 130, 138, 
95, 80, 80, 100, 80, 75, 100, 95, 80, 95, 110, 120, 120, 110, 135, 100, 95, 100, 95, 110, 
100, 95, 125. Qual o custo médio da diária dessa cidade turística, considerando 
todos os hotéis? 


2 Tomando-se os pedidos de combustível dos 20 postos de certa região 
obtiveram-se os seguintes valores (em 1.000 litros): 20, 20, 21, 21, 21, 21, 22, 22, 
22, 22, 22, 22, 23, 23, 23, 23, 23, 24, 24, 26. Monte a distribuição de frequência 
e calcule a média, a moda e a mediana. 


3 Disponha os números 17, 45, 38, 27, 6, 48, 11, 57, 34, 22, 11 em um rol e 
determine a média, mediana e moda. 


4 Elabore a disposição em rol e calcule: a média, a moda, a mediana da seguinte 
amostra de dados:4 8 75331924. 


5 Um levantamento feito com 5000 pessoas separadas de uma grande cidade 
pretende analisar a duração dos casamentos. Os dados coletados estão 


representados na tabela a seguir: 


TABELA 42 — DURAÇÃO DOS CASAMENTOS EM BELO HORIZONTE/MG - 2000 


Anos de Casamentos Número de Separações Fa x, xf 
0 6 2800 
06 [12 1400 
12 -18 600 
18 }24 150 
24 [30 50 
Total 5000 


FONTE: Dados hipotéticos (fictícios) 


Assista ao vídeo de 
resolução da questão 2 


a) Qual a duração média dos casamentos? 
b) Qual é a mediana? 


6 Calcule a média, a moda e a mediana do seguinte agrupamento em classes: 


TABELA 43 — USUÁRIOS CADASTRADOS NA UNIMED POR FAIXA ETÁRIA - 2005 


i Faixa Etária f. Fa. xX. x.f. 


Totais 


FONTE: Os autores 


7 Dados os faturamentos mensais das seguintes filiais de uma grande empresa 
(em milhares de reais): 


Filial A: 20 21 22 2222232324 
Filial B: 16 18 20 22 22 24 26 28 
Filial C: 15 22 23 25 23 24 24 23 


a) calcule o faturamento médio de cada filial; 
b) calcule o faturamento médio global (3 filiais); 
c) calcule a moda e a mediana para cada filial. 


8 Para encerrar as autoatividades deste tópico, vamos fazer palavras cruzadas. 
Preencha os quadrinhos em branco de acordo com o número, de forma que 
em cada um só haja uma letra e que não fique nenhum quadradinho vazio. 


Horizontais: 1 - Quadro onde se apresentam os dados por classes e as 
respectivas frequências. 2 - Tipo de gráfico utilizado para representar variáveis 
discretas. 3 - Medida que representa a diferença entre o maior e o menor valor 
de um conjunto de dados. 4 - A variável estatística. 5 - Subconjunto finito que 
representa a população. 6 - Por vezes agrupam-se os dadosem — (singular). 
7 - Censo é uma pesquisa feita com todo o conjunto 


Verticais: 8 - Estudo estatístico que se baseia numa amostra representativa da 
população. 9 - Antes da escolha da amostra é preciso definir as margens de 
— .10-Chama-se rol, quando os dados estão em | .11-Conjunto universo 
usado como objeto de pesquisa. 12 - Tipo de amostragem utilizada quando 
a população está dividida em grupos diferenciados. 13 - Podem ser discretas 
ou contínuas. 


n8 


UNDADE 2 | TÓPICO 4 


SEPARATRIZES 


| INTRODUÇÃO 


As separatrizes são medidas, como o nome já sugere, que separam a 
distribuição em grupos. A mediana é uma separatriz, embora separe ao meio e 
P 
por isso pode também ser classificada como medida de tendência central. 


Nesse tópico vamos generalizar o conceito da mediana, dividindo a 
distribuição em dois grupos do tamanho que quisermos. Veja, na mediana 
dividíamos a distribuição 50% acima e 50% abaixo, agora poderemos definir 
qualquer porcentagem abaixo e acima, desde que somem 100%. Exemplo: 25% 
abaixo e 75% acima, 30% abaixo e 70% acima, entre outros. 


Estudaremos essa generalização somente no caso de distribuição de 
frequência de dados agrupados. 


2 CÁLCULO DA SEPARATRIZ 


Veja a fórmula para dados agrupados que utilizaremos: 


100 


pz - flo |n 
Co-Lr-—— + 
f 


Note que ela é muito parecida com a fórmula da mediana, na verdade, é 
a mesma fórmula, mas generalizada. Você viu que apareceu um k, na fórmula? 
Esse k representa a porcentagem que você quer fazer na divisão da distribuição. 


Em outras palavras, se você quiser dividir a distribuição 15% abaixo e 
85% acima, você utilizará a separatriz C.., ou seja, k = 15. Se quiser 35% abaixo e 
15 J q 


65% acima, utilizará C,„„ e teremos k = 35. 


Como na mediana o primeiro passo é determinar a classe em que a 
separatriz estará, para isso calculamos: k 2 fi . Olhamos a coluna Fa, o primeiro 


l Sf ~ 100 , i 
maior valor do resultado de kiai será a classe da separatriz (note que é o mesmo 


processo do cálculo da mediana). 


Após definir a classe, aplicamos a fórmula mostrada anteriormente. Veja 
o seguinte exemplo: 


TABELA 44 - PONTUAÇÃO AFERIDA PELAS EQUIPES NO CAMPEONATO 
DE VOLEIBOL - 2006 


i Pontos f. Fa, 


total 20 


FONTE: Os autores 


a) Qual o valor que separa a distribuição 15% abaixo e 85% acima? 


Veja que queremos determinar a separatriz C , logo k = 15. 


Calculamos deb _ 15.20 


0 100 
maior que 3, que, nesse caso, é 6 e se encontra na 2º linha (i = 2). Agora é só 
calcular usando a fórmula: 


=3. Identifique, na coluna Fa, o primeiro valor 


Es —Fa, anterior) "h; 
100 


Ou seja, 15% dos dados são menores ou iguais que 3,5 e 85% dos dados 
são maiores do que 3,5. 


b) Determine, usando a tabela anterior, a separatriz C,.. 


Primeiro determine a classe efetuando o cálculo (lembre-se que nesse caso 

pg 60 
100 100 

está na 4º linha (i= 4). 


=15. O primeiro valor maior que 15 na coluna Fa é 18, que 


Aplicando a fórmula: 


kf 
>f — Fa. (anterior) -h. 
100 ! : 
=]; + 
f, 
nã uj- 
C =7 + 
75 4 
[15-14]|-2 
57 4 
z =7/+— 
7357,9 


Ou seja, 75% dos dados são iguais ou menores que 7,5 e os outros 25% são 
maiores. 


LEITURA COMPLEMENTAR 


O TRABALHO DA MULHER, PRINCIPAL RESPONSÁVEL NO 
DOMICILIO 
(PESQUISA MENSAL DE EMPREGO) - IBGE 


A Pesquisa Mensal de Emprego — PME -, implantada em 1980, tem sido 
um poderoso instrumento de produção de indicadores para o acompanhamento 
conjuntural do mercado detrabalhonasregiões metropolitanas de Recife, Salvador, 
Belo Horizonte, Rio de Janeiro, São Paulo e Porto Alegre, e por extensão, para o 
planejamento econômico e social do país. Trata-se de uma pesquisa domiciliar 
urbana realizada através de uma amostra probabilística, planejada de forma a 
garantir os resultados para os níveis geográficos em que é produzida. 


As grandes transformações ocorridas no mercado de trabalho brasileiro 
desde a implantação da PME impuseram uma revisão completa, abrangendo 
seus aspectos metodológicos e processuais, cujos resultados estão disponíveis 
desde março de 2002. A modernização da Pesquisa Mensal de Emprego visou 
possibilitar a captação mais adequada das características do trabalhador e de 
sua inserção no sistema produtivo, fornecendo, portanto, informações mais 
adequadas para a formulação e o acompanhamento de políticas públicas. No que 
diz respeito a conceitos e métodos, ocorreram atualizações de forma a acompanhar 
as recomendações da Organização Internacional do Trabalho (OIT). 


A revisão da pesquisa tornou possível o aprofundamento da investigação 
e a agregação de alguns aspectos adicionais, permitindo, com isso, estudos acerca 
de diversos temas pertinentes e de interesse da sociedade sobre o mercado de 
trabalho. De acordo com a Pesquisa Mensal de Emprego, o principal responsável 
no domicílio é aquela pessoa que é responsável na unidade domiciliar ou que 
assim for considerada pelos demais moradores. 


O estudo das condições de trabalho e das características das mulheres 
principais responsáveis nos domicílios justifica-se em função da própria expansão 
do percentual de domicílios cujos principais responsáveis são mulheres, que se 
consolida como um dos fatores que contribuem para explicar as transformações 
no perfil da força de trabalho desse sexo e na estrutura familiar nos últimos anos. 


No total das seis regiões metropolitanas, a proporção de mulheres no total 
de pessoas principais responsáveis nos domicílios em idade ativa que, em agosto 
de 2002, correspondia a 34,5%, chegou a 36,9%, em agosto de 2006. No mesmo 
período, a pesquisa também apurou o aumento da participação feminina entre 
as pessoas ocupadas que eram principais responsáveis (de 25,6% para 28,1%). 
Importa destacar que estes percentuais apresentaram-se bastante diferenciados, 
se considerarmos a análise regional. 


Neste sentido, Salvador destacou-se com as maiores participações relativas 
de mulheres entre os principais responsáveis nos domicílios e Rio de Janeiro, com 
as menores. Os dados da Figura 1 tornam evidente a tendência de crescimento da 
presença das mulheres nas populações mencionadas e os da Figura 2 ilustram as 
diferenças significativas de sua distribuição regional. 


Figura 1 


Evolução das participações das mulheres entre os principais responsáveis nos seus 
domicílios em idade ativa e ocupados, para o total das seis regiões metropolitanas, 
nos meses de agosto de 2002 a 2006 (em %) 


34,2 35,8 36,9 


34,5 32,7 


em idade ativa ocupadas 


Dago/02 Dago/03 E ago/04 B ago/05 E ago/06 


Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento, Pesquisa 
Mensal de Emprego 


Figura 2 


Participações das mulheres entre os principais responsáveis nos seus domícilios em 
idade ativa e ocupados, segundo as regiões metropolitanas — Agosto de 2006 (em %) 


SP POA 


D em idade ativa B ocupadas 


Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento, Pesquisa Mensal 
de Emprego 


Nos últimos cinco anos, a pesquisa também captou o crescimento das 
parcelas de principais responsáveis no total da população feminina, reforçando 
a motivação da investigação e a análise do grupamento. Em agosto de 2006, as 
mulheres principais responsáveis nos domicílios em idade ativa (5,4 milhões) 
representavam 25,4% da população feminina em idade ativa no total das seis 
regiões metropolitanas, enquanto em agosto de 2002 este percentual era de 23,4%. 
No mesmo período, também foi registrada a variação positiva no percentual de 
principais responsáveis entre as mulheres ocupadas (de 28,7% para 29,6%). A 
Figura 3 apresenta as evoluções da participação das principais responsáveis entre 
as mulheres em idade ativa e entre as mulheres ocupadas. 
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Acompanhando os dados do primeiro gráfico, percebe-se que a tendência de 
crescimento da proporção de mulheres principais responsáveis no total da população 
feminina em idade ativa é evidente a partir de julho de 2003 (22,0%), tendo atingido o 
seu maior nível em março de 2006 (25,8%). No que se refere à evolução da participação 
das trabalhadoras principais responsáveis entre as mulheres ocupadas, expressa no 
segundo gráfico, a mesma tendência é notada a partir de setembro de 2003 (26,3%), 
alcançando o grau mais elevado em fevereiro de 2006 (29,7%). 


Figura 3 


Evolução da participação das principais responsáveis na população feminina 
em idade ativa, para o total das seis regiões metropolitanas, de agosto de 2002 a 
agosto de 2006 — (em %) 
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Evolução da participação das principais responsáveis na população feminina 
ocupada, para o total das seis regiões metropolitanas, de agosto de 2002 a 
agosto de 2006 (em %) 
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Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento, Pesquisa Mensal de 
Emprego 


Uma questão a ser colocada refere-se à maior proporção de principais 
responsáveis nas populações femininas economicamente ativas (28,0%) e 
ocupadas (29,6%) frente à assinalada para as mulheres em idade ativa (25,4%). 


Figura 4 


Participações das principais responsáveis nos totais das populações femininas 
em idade ativa, economicamente ativa e ocupada, para o total das seis regiões 
metropolitanas — agosto de 2006 (em %) 
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Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento, Pesquisa Mensal de 
Emprego 


Um outro aspecto a merecer registro, e que contribui para a compreensão 
dos resultados apresentados na Figura 4, diz respeito à taxa de atividade das 
mulheres principais responsáveis nos domicílios que, para o agregado das seis 
regiões, em agosto de 2006, chegou a 54,2%, superando a taxa de atividade 
feminina no mesmo período (49,0%). O mesmo pode ser dito em relação ao nível 
estimado de ocupação das principais responsáveis, em agosto de 2006, em 49,8%, 
maior que o da população feminina ocupada (42,7%) em 7,1 pontos percentuais. 


Figura 5 


Taxas de atividade e níveis de ocupação das mulheres principais responsáveis e das 
mulheres, para o total das seis regiões metropolitanas Agosto de 2006 (em %) 
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Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento, Pesquisa Mensal de 
Emprego 


O maior percentual do grupo investigado entre as mulheres ocupadas, 
em particular, está amparado na expressiva participação das mulheres ocupadas 
entre as economicamente ativas principais responsáveis que, em agosto de 2006, 
correspondeu a 92,0%, enquanto a parcela de mulheres desocupadas no grupo 
foi de 8,0%. Ressalta-se ainda que, nos meses de agosto de 2002 a 2006, o estudo 
assinalou o aumento da participação das mulheres ocupadas em detrimento das 
desocupadas, como mostra a Figura 6. 


Figura 6 


Evolução da distribuição de mulheres ocupadas e desocupadas no total de 
mulheres economicamente ativas principais responsáveis, para o total das 
seis regiões metropolitanas — meses de agosto de 2002 a 2006 ( em %) 
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ocupadas 


FONTE: IBGE. O trabalho da mulher, principal responsável no domicílio (pesquisa mensal 
de emprego). Disponível em: <http:/Awmww .ibge.gov.br/nome/estatistica/indicadores/ 
trabalhoerendimento/pme. nova/trabalho. mulher. responsavel. pdf>. Acesso em: 4 jan. 
2011. 


RESUMO DO TÓPICO 4 


Nesse tópico você viu: 
A generalização da mediana. 


Para determinar qualquer separatriz, primeiro calculo a posição, para definir a 
classe. 


Depois de definida a classe em que a separatriz se encontra, usamos a fórmula: 


kf, 
| 100 = fa (ent) |- 
=1 + 


k 1 f 


1 


AUTOATIVIDADE 


1 Com base na próxima tabela, calcule o C 


[4 
O 
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A 


Ci Ca e Cs. 


TABELA 45 — QUANTIDADE DE FALTAS POR FUNCIONÁRIO NO ANO 


DE 2009 
i Faltas f, Fa, 
1 11 [14 2 | 
2 14 [17 14 | 
3 | az s | 
4 20 }23 3 | 
5 23 [26 13 
total 
FONTE: Os autores 


UNIDADE 3 


MEDIDAS DE DISPERSÃO E 
ESTIMAÇÃO 


OBJETIVOS DE APRENDIZAGEM 


A partir desta unidade você será capaz de: 


e efetuar cálculos de medidas de dispersão, transformando a pesquisa em 
números-resumo, para posteriores análises e interpretações; 


e avaliar fenômenos coletivos; 
e avaliar causas, tendências e possíveis consequências; 


e desenvolver e demonstrar a capacidade de execução e interpretação das 
técnicas quanto à existência ou não da correlação; 


e apontar quando a extrapolação é conveniente ou não; 
e efetuar cálculos de intrapolação e extrapolação; 


e apontar possíveis tendências e seus efeitos. 


PLANO DE ESTUDOS 


Esta unidade está dividida em três tópicos e um apêndice. Ao final de cada 
um deles você encontrará atividades que contribuirão para a apropriação dos 
conteúdos. 

TÓPICO 1 - MEDIDAS DE DISPERSÃO 

TÓPICO 2 - MEDIDAS DE DISPERSÃO RELATIVA 

TÓPICO 3 - FUNÇÃO DE REGRESSÃO LINEAR 


APÊNDICE A - ESTATÍSTICA NO EXCEL 


29 
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UNDADE 3 | TÓPICO | 


MEDIDAS DE DISPERSÃO 


| INTRODUÇÃO 


A interpretação de dados estatísticos exige que se realize um número maior 
de estudos, além das medidas de tendência central. 


As medidas de dispersão, também conhecidas como medidas de 
variabilidade, indicam se os valores estão relativamente próximos uns dos outros. 
É a maior ou menor diversificação (distanciamento) dos valores de uma variável 
em torno de um valor de tendência central (média ou mediana) tomado como 
ponto de comparação. 


A média — ainda que considerada como um número que tem a faculdade 
de representar uma série de valores — não pode, por si mesma, destacar o grau de 
homogeneidade ou heterogeneidade que existe entre os valores que compõem 
o conjunto. 


Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z: 


= (70, 70, 70, 70, 70) 
(68, 69, 70 ,71 ,72 } 
{5, 15, 50, 120, 160 } 


X 
Y = 
Z = 

Observamos então que os três conjuntos apresentam a mesma média 
aritmética: 


Entretanto, é fácil notar que o conjunto A é mais homogêneo que os 
conjuntos Be C, já que todos os valores são iguais à média. O conjunto B, por sua 
vez, é mais homogêneo que o conjunto C, pois há menor diversificação entre cada 
um de seus valores e a média representativa. 


Concluímos então que o conjunto A apresenta dispersão nula e que o 
conjunto B apresenta uma dispersão menor que o conjunto C. Portanto, o objetivo 
deste tópico é determinar as dispersões existentes num determinado fenômeno, a 
fim de que se possa melhor avaliá-lo e compreendê-lo. 


2 AMPLITUDE TOTAL 


; É a única medida de dispersão que não tem na média o ponto de referência. 
E a diferença entre o limite superior da última classe e o limite inferior da primeira 
classe. Então AT = L, máximo - l, mínimo = Laax lan. 

Exemplo: para os valores 40, 45, 48, 62 e 70 a amplitude total será: 
AT =70 -40 =30 


A amplitude total tem o inconveniente de só levar em conta os dois valores 
extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso 
da amplitude total quando se quer determinar a variação máxima da temperatura 
em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem 
muita exatidão. 


3 DESVIO PADRÃO 


3.1 DESVIO PADRÃO AMOSTRAL E DESVIO PADRÃO 
POPULACIONAL 


Como já discutido ao longo do caderno, na maioria das vezes trabalhamos 
com amostras. Com isso, é mais comum utilizarmos o desvio padrão amostral, 
que é representado por S. Entretanto, há também o desvio padrão populacional, 
representado por o (sigma). 


Para esclarecer quando é usado o desvio padrão populacional e quando 
é usado o desvio padrão amostral, pense no seguinte: se estivermos falando de 
algumas partes (amostra, grupo etc.), usa-se amostral, quando o problema fala de 
todos (população etc.), usa-se populacional. 


Basicamente a diferença no cálculo dos dois desvios padrões (populacional 
e amostral) é o denominador (o divisor). Enquanto que na populacional dividimos 
pelo número total de elementos n, no amostral dividimos por n-1. A seguir 
veremos exemplos de cálculos dos dois tipos, para que não fiquem dúvidas. 


A 


O desvio padrão baseia-se nos desvios em tomo da média aritmética e a sua 


fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados 
dos desvios e é representada por S ou por o. 


Quanto menor for o desvio padrão em relação à média, maior a 
homogeneidade da distribuição. Ou seja, mais agrupados os dados estarão em 
torno da média. Se o desvio padrão for grande, indica que os dados da distribuição 
estão muito dispersos, ou seja, estão longe da média. 


3.2 CÁLCULO DO DESVIO PADRÃO 


3.2.1 Dados não agrupados 


Nesse caso, seguimos os seguintes passos: 


1º passo: calcular a média dos elementos; 

2º passo: calcular a diferença entre cada elemento e a média (x — X); 

3º passo: elevar essas diferenças à potência dois (x — X)?; 

4º passo: somar todos os resultados obtidos no passo 3; 

5º passo: dividir a soma por n (se for populacional) ou dividir por n-1 (se for 
amostral); 

6º passo: calcular a raiz quadrada do resultado da divisão obtida no passo 5. 


Veja o exemplo: 


Seja a distribuição: 


Cálculo do desvio padrão: 


E pasosnds HI 1; 


2º passo: fazer cada elemento menos a média (11,1); 


5 7 8 10 11 12 15 19 20 
4-11,1= | 5-11,1= | 7-11,1= | 8-11,1= | 10-11,1= | 11-11,1= | 12-11,1= | 15-11,1= | 19-11,1= 20-11,1= 
-7,1 -6,1 -4,1 -3,1 -1,1 -0,1 0,9 3,9 7,9 8,9 


3º passo: elevar cada resultado anterior à potência 2; 


4 5 7 8 10 11 12 15 19 20 
-7,1 -6,1 -4,1 -3,1 -1,1 -0,1 0,9 3,9 7,9 8,9 
(7AP= | (612=| (412= | 31}= | (112=| -0,1}2}= | 02= | 39%2= | 7%= 8,92 = 
50,41 37,21 16,81 9,61 1,21 0,01 0,81 15,21 62,41 79,21 


4º passo: somar os resultados do passo 3; 
50,41 + 37,21 + 16,81 + 9,61 + 1,21 + 0,01 + 0,81 + 15,21 + 62,41 + 79,21 = 272,9 


5º passo: dividir o resultado da soma do passo 4 por n ou por n-1 (dependendo se 
é populacional ou amostral); 


S? 


s O B o? = 2729 27,29 
10-1 10 


Obs.: nesse passo acabamos de calcular a variância amostral S2 e a 
populacional o?; 


6º passo: extrair a raiz quadrada dos resultados do passo 5. 


S = 430,3222 = 5,5066 o =27,29 = 5,2240 


3.2.2 Dados de frequência simples 


Na verdade, faremos os mesmos passos para determinar o desvio padrão 
com frequência simples. Veja o exemplo: 


Calcule o desvio padrão amostral e populacional da tabela de frequência 
simples a seguir: 


TABELA 46 - CÁLCULO DO DESVIO PADRÃO AMOSTRAL 


(PELA MÉDIA) 
X; f, 
3 2 
4 2 
5 3 
6 3 
Total 10 


FONTE: Os autores 


1º passo: calcule a média. 


X; t xX. f, 
3 2 6 
4 2 8 
5 3 15 
6 3 18 
Total 10 47 
ghi E, 
Ef 10 


X; af (x-3) 

3 3-4,7=-1,7 

4 4-4,7=-0,7 

5 15 5-4,7=0,3 

6 18 6-4,7=1,3 
Total 47 


3º passo: eleve os resultados de (x; — X) à potência 2. 


PRA 
X; fo | xf E -X) (x; -X) 
3 2 6 -1,7 (-1,7)2 = 2,89 
4 2 |8 -0,7 (-0,7)2 = 0,49 
5 3 15 0,3 (0,3)? = 0,09 
6 3 18 1,3 (1,3)? = 1,69 
Total 10 47 


4º passo: multiplique cada resultado do passo anterior pela frequência da classe e 
some os resultados. 


3 2 6 -1,7 2,89 2,89.2 = 5,78 
4 2 8 -0,7 0,49 0,49.2 = 0,98 
5 3 15 0,3 0,09 0,09.3 = 0,27 
6 3 18 1,3 1,69 1,69.3 = 5,07 
Total 10 47 12,1 


5º passo: divida a soma 12,1 obtida no passo 4 por È f, =10 se for populacional ou 
por È f,-1=9 se for amostral. 


S2 = e =1,3444 o? = =A =1,21 
10-1 10 
6º passo: extraia a raiz quadrada dos resultados do passo 5. 
S=,1,3444 =1,1595 o=1,21=1,1 


3.2.3 Frequência de classes 


Quando os dados estão agrupados (temos a presença de frequências), a 
== 2 

Zi 
pf 


para dados populacionais. Essas fórmulas só resumem os 


fórmula do desvio padrão ficará: S = 
Z-s] 
a 


passos que já fizemos anteriormente, veja no exemplo: 


para dados amostrais e 


O = 


Diário de Classe 


Considerando as notas de Português no 4° bimestre de 2002, calcule o 
desvio padrão. 


TABELA 47 — NOTAS NA DISCIPLINA DE PORTUGUÊS ESCOLA B - 
LONDRINA/PR — 4º BIMESTRE DE 2002 


— 


Notas (x,) Alunos (f) 


1+2 
2 -3 
3 F4 
4 }5 
5 F6 
6 }7 
7 ts 
8 -9 
9 +10 


o o Nona A UON B 
e N Ae SO RR Be 


Q 
jam) 


Total 


FONTE: Os autores 


1º passo: calcule a média. 


Para isso precisamos calcular a coluna x, (pontos médios das classes) e a 


Edi, EE Gu 
coluna f.x, para calcular a média: X = Lx fi 
2 fi 
i Notas (x,) Alunos (f) X; xf, 
1 1 }2 1 1,5 1,5 
2 2 }3 1 25 2,5 
3 3 -4 2 3,5 7,0 
4 4 5 7 4,5 31,5 
5 5 }6 5 5,5 27,5 
6 6 }7 4 6,5 26,0 
7 7 }8 4 7,5 30,0 
8 8 -9 2 8,5 17,0 
9 9 +10 4 9,5 38,0 
Total 30 181 
= Èx- f, 181 
ze 16 4 igas 


º passo: subtraia a média do ntos médios x, ou seja, fazer (x; — X). 
2º passo: subt édia dos pontos médios x, seja, fazer (x; — X) 


i (x) (£) xX x- f, x; =X 

1 1+2 1 15 15 1,5 — 6,0333 = -4,5333 
2 2 [3 1 2,5 2,5 2,5 — 6,0333 =-3,5333 
3 3 -4 2 3,5 7,0 3,5 — 6,0333 = -2,5333 
4 4 }5 7 4,5 31,5 4,5 — 6,0333 = -1,5333 
5 5 -6 5 5,5 27,5 5,5 — 6,0333 = -0,5333 
6 6 }7 4 6,5 26,0 6,5 — 6,0333 = 0,4667 
7 7 }8 4 7,5 30,0 7,5 — 6,0333 = 1,4667 
8 8 -9 2 8,5 17,0 8,5 — 6,0333 = 2,4667 
9 9 }10 4 9,5 38,0 9,5 — 6,0333 = 3,4667 

Total 30 181 


3º e 4º passos: eleve os resultados de x, -X ao quadrado e multiplique pela 


EA 
frequência da classe, ou seja, faremos: (x; -X ) fi- 


1 1 15 15 -45333 (-4,5333)2.1 = 20,5508 
2 2 3 1 25 25 -3,5333 (-3,5333)2.1 = 12,4842 
3 3 F4 2 3,5 7,0 -2,5333 (-2,5333)2.2 = 12,8352 
4 4 5 7 45 315 -1,5333 (-1,5333)2.7 = 16,4571 
5 5 t6 5 55 275 -0,5333 (-0,5333)2.5 = 1,4220 
6 6 |7 4 65 260 0,4667 (0,4667)2.4 = 0,8712 

7 7 8 4 75 300 14667 (1,4667)2.4 = 8,6048 

8 8 9 2 85 170 24667 (2,4667)2.2 = 12,1692 
9 9 LO 4 95 380 3,4667 (3,4667)2.4 = 48,0720 

Total 30 181 133,4665 


5º passo: divida a soma 133,4665 obtida no passo 4 por È f, = 30 se for populacional 
ou por È fı—-1=29 se for amostral. 


E(x-X)-f 133,4665 E(x -XÝ-f,_ 133,4665 
a s40. ot E 


2 =4,4489 
Łf,-1 30-1 Ef; 


6º passo: extraia a raiz quadrada dos resultados do passo 5. 


S = 44,6023 = 2,1453 o =44,4489 = 2,1092 


RESUMO DO TÓPICO | 


Neste tópico você estudou que: 


e O desvio padrão é a medida de dispersão mais empregada na Estatística. 


Para o cálculo do desvio padrão para dados amostrais usa-se a fórmula 


E 


D 


Para dados populacionais, usamos a fórmula o = S7 
i 
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AUTOATIVIDADE 


Caro/a acadêmico/a, entenda melhor este assunto resolvendo as 
seguintes autoatividades: 


1 A tabela a seguir indica as notas de uma turma, na disciplina de Matemática. 
Calcule o desvio padrão amostral para a média das notas destes alunos. 


TABELA 48 — AVALIAÇÃO DOS ALUNOS DA ESCOLA BÁSICA LAURO 

MULLER - TUBARÃO/SC - 2002 
I Notas f, 
1 3 F4 4 
2 4 }5 7 
3 5 6 9 
4 6 }7 15 
5 7 ts 10 
6 8 to 3 
7 9 }10 2 

K=7 Total 50 
FONTE: Dados hipotéticos (fictícios) 


Assista ao vídeo de 
resolução da questão 1 


2 Ostempos de reação de um indivíduo a determinados estímulos, medidos por um 
psicólogo, foram: 0,53 — 0,46 — 0,50 — 0,49 — 0,52 — 0,44 — 0,55 segundos. Determine 
o tempo médio e o desvio padrão de reação do indivíduo a esses estímulos. 


3 Determine, da distribuição de frequência a seguir: 


TABELA 49 — DISTRIBUIÇÃO SALARIAL DOS FUNCIONÁRIOS DE UMA 
AGÊNCIA DE TURISMO - MINAS GERAIS - 2006 


i Salários (R$) Nº de funcionários 
1 500 } 700 18 
2 700 } 900 31 
3 900 [1100 15 
4 1100 } 1300 3 
5 1300 [1500 1 
6 1500 } 1700 1 
7 1700 [1900 1 
K=7 Total 


FONTE: Dados fictícios 


a) a média; 

b) a moda; 

c) a mediana, 

d) o desvio padrão amostral. 


4 Dados os conjuntos de números: 
A = (220, 230, 240, 250, 260 ) B = { 20, 30, 40, 50, 60 ) 


a) Calcule o desvio padrão do conjunto A. 
b) Calcule o desvio padrão do conjunto B. 
c) Que relação existe entre os desvios padrões dos dois conjuntos de números? 


5 Dados os conjuntos de números: A = { -2, -1, 0, 1, 2 } B = { 220, 225, 230, 235, 
240}. Calculando o desvio padrão, podemos afirmar que o desvio padrão de 
B é igual ao desvio padrão de: 


a)( JA; 

b)( ) A multiplicado pela constante 5; 

c) ( ) A multiplicado pela constante 5 e esse resultado somado a 230; 
d)( ) A mais a constante 230. 


6 Determine o desvio padrão amostral, populacional e o coeficiente de variação 
dos dois casos dos dados: 


10 20 22 18 13 09 18 35 21 22 


UNDADE 3 | TÓPICO 2 


MEDIDAS DE DISPERSÃO RELATIVA 


| INTRODUÇÃO 


Na Estatística utilizam-se diversas medidas para descrever fenômenos. 
Algumas são as de tendência central e outras as de dispersão. 


Dentre as medidas de dispersão, já estudamos o desvio padrão. Entretanto, 
uma medida muito utilizada, principalmente para se comparar medidas, é o 
coeficiente de variabilidade ou apenas coeficiente de variação (CV). E é este o 
objetivo deste tópico. 


2 COEFICIENTE DE VARIAÇÃO 


O coeficiente de variação é uma medida de variabilidade relativa, pois é a 
relação entre o desvio padrão (S) e a média aritmética ( X ), multiplicada por 100. 


Portanto, o coeficiente de variação (CV) é uma medida de dispersão cujo 
objetivo é apresentar a variabilidade da distribuição em termos percentuais (%). 


É o 


Como já estudamos na Unidade 1, o coeficiente é um valor decimal; quando 
multiplcamos por 100 chamamos de taxa (valor percentual). Contudo, no caso do CV 


(coeficiente de variação), apesar de ser chamado de coeficiente, é apresentado como 
percentual, então é necessária a multiplicação por 100. 


O coeficiente de variação é utilizado principalmente na comparação da 
variabilidade de dois conjuntos de valores que possuem unidades de medidas 
distintas. 


Na Estatística Descritiva o desvio padrão por si só tem grandes limitações. 
Assim, um desvio padrão de 2 unidades pode ser considerado pequeno para uma 
série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o 
mesmo não pode ser dito. 


Além disso, o fato de o desvio padrão ser expresso na mesma unidade 
dos dados limita o seu emprego quando desejamos comparar duas ou mais séries 
de valores, relativamente à sua dispersão ou variabilidade, quando expressas em 
unidades diferentes. 


Para contornar essas dificuldades e limitações, podemos caracterizar a 
dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, 
medida essa denominada de CV (Coeficiente de Variação). 


A fórmula do cv=2.100 ( o resultado neste caso é expresso em 


percentual, entretanto pode ser expresso também através de um fator decimal, 
desprezando assim o valor 100 da fórmula). 


Fique ligado/a! Quando o desvio padrão calculado for o populacional, usa-se: 


cv=:100. 
X 


Caso a medida de tendência central utilizada for a mediana, substituir, no coeficiente de 


variação, a média ( X ) pela mediana (Md). 


Exemplo: 


Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de 
indivíduos: 


TABELA 50 - COMPARAÇÃO ENTRE A MÉDIA E O DESVIO PADRÃO 


Discriminação Desvio-Padrão 
Estaturas 175 cm 5,0 cm 
Pesos 68 kg 2,0 kg 


FONTE: Os autores 


Qual das medidas (Estatura ou Peso) possui maior homogeneidade? 


Resposta: teremos que calcular o CV da Estatura e o CV do Peso, porque só 
o desvio padrão não informará qual distribuição é mais dispersa (como discutido 
anteriormente), uma vez que os valores são numericamente diferentes (enquanto 
a altura está na casa das centenas, o peso está na casa das dezenas). O resultado 
menor será o de maior homogeneidade (menor dispersão ou variabilidade). 


CV estatura = Ea -100 = 2,85% 
175 


CV peso = Z a100 = 2,94% 


Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de 


dispersão que os pesos. 


3 MEDIDAS DE ASSIMETRIA (TENDÊNCIA) 


Uma distribuição é considerada simétrica quando: média = mediana = 


moda. 


Portanto, uma distribuição é considerada: 


e assimétrica à esquerda ou positiva quando: moda < mediana < média, ou seja, 


X-Md>0. 


e assimétrica à direita ou negativa quando: média < mediana < moda, ou seja, 


X-Md<0. 


Exemplo: a) Observe os tipos de assimetria das distribuições a seguir: 


Distribuição A Distribuição B Distribuição C 
i Classes f, i Classes f, i Classes f, 
1 | 0206 | 06 1 | 02+06 | 06 1 | 02406 | 06 
2 | oo | 12 2 | o6tio |12 2 | o [10 |30 
3 | 10 -14 | 24 3 | 10-14 |24 3 10 -14 |24 
4 | 14 +18 | 12 4 | 1418 |30 4 | 14 þ18 | 12 
5 | 18-22 | 06 5 | 18 }22 | 06 5 | 18-22 | 06 
Total 60 Total 78 Total 78 
40 ii 40 
20 20 J 20 
mm =i 0 
né or tos ostio 10fié sapis sat | oa bos o6k1o 10h16 ahas 18H22 o o tos oshio sopis tepis 18f22 
DistribuiçãoA Distribuição B DistribuiçãoC 
- — 100 — 4 
X jo Tre X L yi 
60 78 78 


Md , =10+ V Bige map =104(2-E)4=13,5 
24 24 


145 


Portanto: X4-Md,=12-12=0. Ou seja, não apresenta assimetria 
(simétrica). 


Xp —- Md, =12,92 -13,5 = -0,58 . Ou seja, apresenta assimetria à direita. 


Xc- Md, =11,08-10,5 = +0,58 . Ou seja, apresenta assimetria à esquerda. 


RESUMO DO TÓPICO 2 


Neste tópico você estudou: 


O coeficiente de variação populacional: CV = z -100 


O coeficiente de variação amostral: CV = = -100 


O CV é usado para comparar a variabilidade entre duas grandezas com 
unidades diferentes, uma vez que apresenta o resultado da variabilidade em 
percentual. 

Uma distribuição é considerada simétrica quando: média = mediana = moda. 


Portanto, uma distribuição é considerada: 


e assimétrica à esquerda ou positiva quando: moda < mediana < 


média, ou seja, X-Md>0. 


e assimétrica à direita ou negativa quando: média < mediana < 
moda, ou seja, X - Md <0. 


AUTOATIVIDADE 


Entenda melhor este assunto fazendo as seguintes autoatividades: 


1 A renda média mensal na localidade A é de R$ 750,00 e na localidade B é de 
R$ 500,00. Os desvios padrões são R$ 100,00 e R$ 80,00. Faça uma análise 
comparativa quanto ao grau de homogeneidade da renda nestas duas 
localidades. 


2O risco de uma ação de uma empresa pode ser devidamente avaliado 
através da variabilidade dos retornos esperados. Portanto, a comparação das 
distribuições probabilísticas dos retornos, relativas a cada ação individual, 
possibilita a quem toma decisões perceber os diferentes graus de risco. Analise 
os dados estatísticos relativos aos retornos de 5 ações descritas na tabela a 
seguir e diga qual é a menos arriscada. 


TABELA 51 — AVALIAÇÃO DO RISCO DAS AÇÕES - EMPRESA X - 2004 


Discriminação Ação A AçãoB | AçãoC | AçãoD Ação E 

Valor esperado 15% 12% 5% 10% 4% 

Desvio-Padrão 6% 6,6% 2,5% 3% 2,6% 
Coeficiente de Variação 0,40 0,55 0,50 0,30 0,65 


FONTE: Os Autores 


3 Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio 
padrão igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura média 
de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de 
variação de cada um dos grupos? Qual o grupo mais homogêneo? 


4 Um grupo de 196 famílias tem renda média de 163,8 dólares, com um 
coeficiente de variação de 3,3%. Qual o desvio padrão da renda desse grupo? 


5 Uma distribuição apresenta as seguintes estatísticas: S = 1,5 e CV = 2,9 % . 
Determine a média da distribuição. 


6 A seguir temos a distribuição do número de acidentes por dia, durante 53 
dias, em certa rodovia: 


TABELA 52 - NÚMERO DE ACIDENTES DIÁRIOS DA RODOVIA BR 470 - 2009 


O os 


FONTE: Dados hipotéticos 


Determine o desvio padrão amostral, o coeficiente de variação e indique 
o tipo de tendência que se apresenta. 
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UNDADE 3 TÓPICO 3 


FUNÇÃO DE REGRESSÃO LINEAR 


| INTRODUÇÃO 


Em muitas situações, torna-se interessante e útil estabelecer uma relação 
entre duas ou mais variáveis. A matemática estabelece vários tipos de relações 
entre variáveis, por exemplo, as relações funcionais e as correlações. 


Em Estatística, quando estabelecemos uma relação entre duas grandezas, 
é possível encontrar uma função que nos permite analisar a situação em estudo, 
tirar conclusões e fazer previsões ou estimativas. O objetivo deste tópico é estudar 
a existência ou não da correlação entre duas variáveis e estimar (prever) alguns 
valores, dentro de parâmetros aceitáveis, através da equação de regressão linear. 


2 COEFICIENTE DE CORRELAÇÃO DE PEARSON 


Através do coeficiente de correlação poderemos observar e avaliar os 
tipos de correlações existentes, para então estabelecer a equação de regressão 
mais adequada para o cálculo das estimativas desejadas. 


a) RELAÇÕES FUNCIONAIS 
Relações funcionais são relações expressas por sentenças matemáticas. 
São exemplos dessas relações: 

e área do retângulo (A = a . b) é a relação entre os lados do retângulo; 


e densidade de massa (d = m/v) é a relação entre a massa e o volume de um 
corpo; 


e perímetro de uma circunferência (C = 2rR) é a relação entre o comprimento da 
circunferência e o valor do raio. 


b) RELAÇÕES ESTATÍSTICAS E CORRELAÇÕES 


São relações estabelecidas após uma pesquisa. Com base nos resultados 
da pesquisa, fazem-se comparações que eventualmente podem conduzir (ou não) 
a ligações entre as variáveis. Exemplo: relação entre a idade e a estatura de uma 
criança ou a relação entre a classe social de uma pessoa e o número de viagens 
por ela realizadas. 


No estudo estatístico, as relações entre duas ou mais variáveis denominam- 
se correlação. 


c) DIAGRAMA DE DISPERSÃO 


A tabela a seguir será usada para graficarmos um diagrama de dispersão 
da relação entre o percentual regional de posse de aparelhos de CD e renda média. 
Nosso objetivo é visualizar a disposição dos pontos para visualizar a dispersão 
dessa relação. 


TABELA 53 — PERCENTUAL REGIONAL DE POSSE DE APARELHOS DE CD E 
RENDA MÉDIA - 2009 


X, i 

1 170,4 57 
2 179,1 56 
3 203,2 65 
4 204,8 71 
5 208,8 70 
6 248,0 70 
7 192,4 58 
8 183,2 60 
8 187,1 63 
10 198,3 51 
11 172,9 43 
Total 2.148,2 664 


FONTE: Os autores 


Fazendo o gráfico dos pontos (X,Y) veremos a dispersão: 


0 50 100 150 200 250 300 


Em seguida veremos que fazer uma regressão linear significa achar a 
equação da reta que melhor representa o padrão dos dados. Se a reta capta o 
padrão, passa a atuar como modelo, embora imperfeito, porque é construída com 
os dados e reflete as características deles. 


d) COEFICIENTE DE CORRELAÇÃO DE PEARSON 
Para se estabelecer possíveis correlações entre as variáveis apresentadas, 


será necessário aplicar o modelo matemático do coeficiente de correlação de 
Pearson, que segue: 


Dr (EE) 
[Pe-o] 


r= 


Na fórmula n é o número de observações. Os valores limites de r são -1 
e +1. Se r = +1 a correlação é perfeita positiva. Se r = -1 a correlação é perfeita 
negativa e se r = 0 não há correlação entre os pontos, ou a correlação não é linear. 


GRÁFICO 9 — DISPERSÃO DA RELAÇÃO ENTRE A RENDA MENSAL E O PERCENTUAL DE 
DOMICÍLIOS COM APARELHOS DE CD 
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FONTE: Os autores 


Quanto mais próximo do valor "1" estiver o valor de “r”, mais forte a correlação 
linear; quanto mais próximo do valor “0” estiver o valor de "r", mais fraca a correlação linear. 


7/0974 
r 


Em geral, multiplica-se o valor de 
passe a ser representado em porcentagem. 


por 100, a fim de que o resultado 


Na prática, estabelecem-se critérios para verificar os diversos níveis de 
correlação, ou seja, do fraco ao forte, chegando ao perfeito: 


e 0< |r | <0,3:a correlação é extremamente fraca e fica difícil estabelecer relação 
entre as variáveis. Em porcentagem: 0 < | r | < 30%; 


e 0,3< | r I <0,6: a correlação é fraca, porém podemos considerar a existência de 
relativa relação entre as variáveis. Em porcentagem: 30% < | r | < 60%; 


e 0,6<lrl<1:a correlação é média para forte, a relação entre as variáveis é 
significativa, o que permite coerência com poucos conflitos na obtenção das 
conclusões. Em porcentagem: 60% < | r | < 100%. 


Exemplo: uma pesquisa pretende verificar se há correlação significativa 
entre o peso total do lixo descartado, por dia, num hotel com o peso do papel 
contido nesse lixo. 


TABELA 54 — PESO TOTAL DO LIXO DESCARTADO E O PESO DO PAPEL 
CONTIDO NESSE LIXO 
HOTEL PESO TOTAL PESO DO PAPEL 

H, 10,47 2,43 

H, 19,85 5,12 

H, 21,25 6,88 

H, 24,36 6,22 

H, 27,38 8,84 

H, 28,09 8,76 

H, 33,61 7,54 

H, 35,73 8,47 

H, 38,33 9,55 

Ho 49,14 11,43 

Total 

FONTE: Os autores 


Observe como ficará o gráfico de dispersão com a linha de tendência linear 
referente aos pesos do lixo descartado e o papel contido neste lixo. 


GRÁFICO 10 — CORRELAÇÃO ENTRE O PESO TOTAL DO LIXO DESCARTADO E O PESO 
DO PAPEL CONTIDO NESSE LIXO 
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FONTE: Os autores 


Já a próxima tabela nos mostra todos os passos utilizados para efetuar o 
cálculo do coeficiente de correlação. 


TABELA 55 - CÁLCULO DO COEFICIENTE DE PEARSON PARA A CORRELAÇÃO ENTRE O PESO 
TOTAL DO LIXO DESCARTADO E O PESO DO PAPEL CONTIDO NESSE LIXO 


Hotel Peso Total (x) | Peso Papel (y,) XY; x, y` 
H, 10,47 2,43 25,44 109,62 5,90 
H, 19,85 5,12 101,63 394,02 26,21 
H, 21,25 6,88 146,20 451,56 47,33 
H, 24,36 6,22 151,52 593,41 38,69 
H, 27,38 8,84 242,04 749,66 78,15 
H, 28,09 8,76 246,07 789,05 76,74 
H, 33,61 7,54 253,42 1129,63 56,85 
H, 35,73 8,47 302,63 1276,63 71,74 
H, 38,33 9,55 366,05 1469,19 91,20 
Ho 49,14 11,43 561,67 2414,74 130,64 

Total 288,21 75,24 2396,68 9377,52 623,47 


FONTE: Os autores 


n5 x (Dx (2) 
[E-E E-E] 


= 10-2396,68 — 288,21- 75,24 
V[10-9377,52- (288,21) ]-[10-623,47-(75,24)] 


Calcule o coeficiente de correlação: r = 


= 23966,8 — 21684,92 E 2281,88 
(93775,2 — 83065,0) -(6234,7 — 5661,06) /10710,2-573,64 


2281,88 2281,88 


r= = = 
~ 6143799,13 2478,67 


0,92 


Portanto, observa-se que: 0,6 < |r| < 1. Esse resultado indica que há 
uma forte correlação entre as variáveis, ou ainda que a correlação entre as duas 
variáveis é bastante significativa. Neste caso, podemos concluir haver coerência 
na afirmação de que existe correlação entre o peso total do lixo descartado e o 
peso do papel contido nesse lixo. 


3 FUNÇÃO DE REGRESSÃO LINEAR 


e REGRESSÃO-RETA DE REGRESSÃO (OU RETA DE MÍNIMOS QUADRADOS 
OU RETA DE AJUSTE) 


Podemos dizer que a análise de regressão tem por objetivo descrever, através 
de um modelo matemático, a relação entre duas variáveis partindo de n observações 
das mesmas. A variável sobre a qual desejamos fazer uma estimativa recebe o nome 
de variável dependente e a outra recebe o nome de variável independente. Assim, 
teremos sempre “x” como variável independente e “y” como variável dependente, 


na função y = ax + b, onde a e b são parâmetros. 


Sabemos que a equação da reta que relaciona duas variáveis é dada por 
(Y =aX +b). “Y” representa os que possuem CD e “X” representa a renda média 
semanal. A constante “b” é o coeficiente linear que determina o ponto onde a 
reta intercepta o eixo de y, no momento em que x vale zero. O valor de “a” é o 
coeficiente angular, isto é, a tangente do ângulo formado entre a reta e o eixo de 


x, ou seja, Ay/Ax onde delta é um símbolo que indica variação. 


Podemos calcular os valores dos parâmetros a e b, com a ajuda das 
fórmulas: 


Atenção, n é o número de observações, 


o: 
e 


x, é a média dos valores x, ou seja, x = 
n 


y é a média dos valores y,, ou seja, y = 2% 
n 


Na verdade, quando aplicamos estas fórmulas estamos fazendo uso 
de uma amostra para obter os valores dos parâmetros. O resultado, então, é 
uma estimativa da verdadeira equação de regressão. Sendo assim, escrevemos 


Y =aX +b, onde Y éo Y estimado. 
Exemplo: consideremos uma amostra aleatória, formada por 10 dos 98 


alunos de uma classe da faculdade de Administração e suas respectivas notas de 
Matemática e Estatística para estabelecermos um parâmetro. 


TABELA 56 - NOTAS DE MATEMÁTICA E ESTATÍSTICA DA TURMA A CURSO DE 
ADMINISTRAÇÃO — UFMG — 2003 


Nº do aluno Nota de Matemática Nota de Estatística 
01 5,0 6,0 
08 8,0 9,0 
24 7,0 8,0 
38 10,0 10,0 
44 6,0 5,0 
58 7,0 7,0 
59 9,0 8,0 
72 3,0 4,0 
80 8,0 6,0 
92 2,0 2,0 


FONTE: Os autores 


Representado os dados num sistema cartesiano ortogonal, os pares 
ordenados (x, y,), obtemos uma nuvem de pontos que denominamos diagrama 
de dispersão. Este diagrama nos fornece uma ideia grosseira, porém útil, da 
correlação existente: 


GRÁFICO 11 - NOTAS DE MATEMÁTICA E ESTATÍSTICA DA TURMA A CURSO DE 
ADMINISTRAÇÃO - UFMG - 2009 


Nota de Estatística 


FONTE: Os autores 
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Nota de Matemática 


Os pontos obtidos, vistos em conjunto, formam uma espécie de elipse em 
diagonal. Podemos imaginar que quanto mais fina for esta elipse, mais ela se 
aproximará de uma reta. Dizemos então que a correlação tem como imagem uma 
reta, sendo por isso denominada correlação linear. A imagem desta correlação é 
uma reta ascendente, que é chamada correlação linear positiva. 


Vamos agora organizar a tabela de valores: 


TABELA 57 — CÁLCULO DAS NOTAS DE MAT EMÁTICA E ESTATÍSTICA DA TURMA A DO 
CURSO DE ADMINISTRAÇÃO - UFMG - 2003 

i X; y; XY; x? y? 

1 5,0 6,0 30 25 36 

2 8,0 9,0 72 64 81 

3 7,0 8,0 56 49 64 

4 10,0 10,0 100 100 100 

5 6,0 5,0 30 36 25 

6 7,0 7,0 49 49 49 

7 9,0 8,0 72 81 64 

8 3,0 4,0 12 9 16 

9 8,0 6,0 48 64 36 

10 2,0 2,0 4 4 4 

n=10 L=65 L=65 L=473 L=481 L=475 


FONTE: Os autores 


nS Xi DMD); 10-473-65.65 4730-4225 _ 505 


=0,86 
n5 x (Dx) 10-481- (65) “4810-4225 585 


b=y-—ax 

onde 

J->% 68 65 z-i o 6,5 
n 10 n 10 


Assim, b=y-a-x=6,5-0,86-6,5=6,5-5,59= 0,91. 


Aplicando as fórmulas para encontrar os parâmetros a e b, chegaremos à 


seguinte função de regressão linear: Y = 0,86X + 0,91. Com esta função poderemos 
estimar qualquer nota de Matemática e estimar sua nota correspondente em 
Estatística. 


Exemplo: estime a nota de Estatística para uma nota 8,5 em Matemática. 


A 


Para isso basta pegar a função Y e substituir x por 8,5: 


Y =0,86X + 0,91 = 0,86.8,5 + 0,91 = 7,31 + 0,91 = 8,22. 


Portanto, a nota estimada de Estatística será de 8,22. 


Quando usamos valores entre os limites do intervalo, dizemos que foi feita uma 
interpolação; quando usamos valores não contidos no intervalo, dizemos que foi feita uma 
extrapolação. 


RESUMO DO TÓPICO 3 


Neste tópico você estudou: 

EEE) 
Es -EA PE- 
DRDD ADA 


A fórmula para o cálculo de a = 
P n9, x? — O, X; %7 


Coeficiente de correlação de Pearson: r = | 


A fórmula para o cálculo de b = y- ax. 


O resultado da regressão é uma estimativa da verdadeira equação de regressão. 


A A 
Sendo assim, escrevemos Y =aX +b, onde Y éo Y estimado. 


AUTOATIVIDADE 


1 Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos 
e seu peso real em gramas. A mvédia do grupo está no seguinte quadro: 


Peso real 18 30 42 62 73 97 120 
Peso aparente 10 23 33 60 91 98 159 


Estime o peso real para um peso aparente de 300 gramas. 


2 Considere o resultado de dois testes obtidos por um grupo de internautas: 


a) Determine a função de regressão linear. 
b) Estime Y para X = 50. 


3 O quadro a seguir apresenta a produção de uma indústria: 


Anos | 1990 | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 
Quant. (t) | 34 | 36 36 38 | 41 42 | 43 | 4 | 46 


a) Calcule o coeficiente de correlação. 
b) Calcule a produção estimada para 2007. 
c) Estime o ano em que a produção atingirá 75 toneladas. 


4 O quadro a seguir mostra como o comprimento de uma barra de aço varia 
conforme a temperatura: 


Temp. em graus C. 10 15 20 25 30 
Comp. em mm 1,003 | 1,005 | 1,010 | 1,011 | 1,014 


a) Determine o coeficiente de correlação. 
b) Calcule a equação da reta ajustada a esta correlação. 


c) Determine o valor estimado do comprimento da barra para a temperatura 
de 35°C. 

d) Considerando que, na temperatura ambiente, a barra continha um metro de 
comprimento, estime a temperatura em que a barra de ferro medirá 1,05 m. 


5 Certa empresa, estudando a variação da demanda de seu produto em relação 
à variação de preço de venda, obteve o quadro: 


Preço x 42 50 56 59 63 70 80 95 | 110 
Demanday | 325 | 297 | 270 | 256 | 246 | 238 | 223 | 215 | 208 


a) Estime a demanda para o preço de 120. 
b) Estime o preço para uma demanda de 500 e analise o resultado. 


resolução da questão 5 [mins 
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[APÊNDICE A | A 


ESTATÍSTICA NO EXCEL 


| INTRODUÇÃO 


O Excel é um programa muito útil nos estudos estatísticos, tornando o 
aprendizado mais ágil e agradável. É possível desenvolver funções estatísticas, 
gráficos, tabelas, medidas de posição e regressões utilizando o Excel. Para isso é 
preciso dispor de um conjunto de dados. 


2 PLANILHA ELETRÔNICA 


Para esta demonstração usaremos dados quantitativos de uma instituição 
de Ensino Superior fictícia, referentes ao número de alunos por curso. 


TABELA 58 — MATRÍCULAS, POR GÊNERO, NOS CURSOS DA UFSC - 2009 


Ordem Cursos Alunos Masculino Feminino 
1 Administração Gestão Imobiliária 32 15 17 
2 Ciências Contábeis 265 159 106 
3 Ciências Econômicas 34 29 5 
4 Comércio Exterior 405 284 121 
5 Design Moda 250 11 239 
6 Direito 758 379 379 
7 Finanças 467 327 140 
8 Marketing 905 500 405 
9 Normal Superior - Séries Iniciais 489 19 470 
10 Normal Superior Educação Infantil 67 6 61 
11 Publicidade e Propaganda 329 165 164 
12 Recursos Humanos 484 250 234 
13 Relações Públicas 134 65 69 
14 Sistemas de Informação 575 460 115 
15 Turismo 240 48 192 
k=15 Total L = 5434 Ł = 2717 L=2717 


FONTE: Os autores 


Procedimentos para a elaboração de um gráfico no Excel. 


APÊNDICE A 


2.1 PREPARANDO A PLANILHA 


Digite a tabela anterior numa planilha do Excel, da mesma forma como 
foi apresentada. Depois de digitada, ficará assim: 


FIGURA 1 — FORMATAÇÃO DO EXCEL — DIGITAÇÃO DA PLANILHA 
A g | (03 | D 

ALANOS DE GRADUAÇÃO 

CURSOS [MASCULINO] FEMININO 

Administração Gestão 

Imobiliária 

Ciências Contábeis 

Ciências Econômicas 

Comércio Exterior 

Design Moda 

Direito 

Finanças 467 

Marketing 

Normal Superior - Séries 

Iniciais 

Normal Superior Educação 

Infantil 

Publicidade e Propaganda 

Recursos Humanos 

Relações Públicas 

Sistemas de Informação 

17 Turismo 

18 Total 


FONTE: Os autores 
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Depois, os dados copiados para a planilha podem ser mostrados na forma 
de gráficos, como mostramos a seguir: 


GRÁFICO 12 — NÚMERO DE ALUNOS, POR CURSO, DA UFSC - 2004 
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FONTE: Os autores 
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APENDICE A 


Como os nomes dos cursos utilizam muito espaço no eixo de x, este gráfico 
fica esteticamente mais apresentável se for feito em forma de barras ao invés de 
colunas: 


GRÁFICO 13 - NÚMERO DE ALUNOS, POR CURSO, DA UFSC - 2004 
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FIGURA 2 — FORMATAÇÃO DO EXCEL — VISUALIZAÇÃO DA BARRA DE FÓRMULAS 
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Cada célula é localizada por sua coluna (A, B, C, ...) e sua linha (1,2,3,...). 
Exemplo: “Alunos de Graduação” está na coluna A, linha 1. Isto representa Al. 


Ao trabalhar um conjunto de dados é interessante inserir uma nova 
planilha e copiar a tabela para esta planilha. 


Para inserir uma nova planilha clique (shift + f11) ou clique na aba que se 
encontra ao lado do nome das planilhas já existentes (em destaque na próxima figura): 
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FIGURA 5 — LOCAL PARA ABRIR UMA PLANILHA 


FONTE: Os autores 


Com isso será aberta uma nova planilha e é interessante dar um nome a 
ela. Para tanto é preciso mudar o nome anterior clicando com o botão direito do 
mouse na seleção de planilhas na parte inferior da pasta. 


FIGURA 4 — FORMATAÇÃO DO EXCEL — NOMEAR PLANILHAS 


FONTE: Os autores 


FIGURA 5 — FORMATAÇÃO DO EXCEL — RENOMEAR PLANILHAS 
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Depois que aparecer o menu de seleção, escolha Renomear para mudar 
o nome da planilha. O nome será mudado para “Estatística”, mas poderia ser 
qualquer um. 


Quando existe um número grande de planilhas, é mais prático identificá- 
las com nomes que tenham relação com o que é trabalhado nelas. 
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2.2 ORDENANDO DADOS 


Muitas vezes os dados coletados estão embaralhados, e há a necessidade 
de colocá-los ou em ordem crescente, ou em ordem decrescente. Para tanto se 
devem selecionar todos os dados da tabela, porque todas as colunas estão 
relacionadas entre si. A próxima figura mostra a seleção: 


FIGURA 6 — FORMATAÇÃO DO EXCEL — SELEÇÃO 
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Em seguida clica-se no menu Dados e escolhe-se a opção Classificar. A 
janela de classificação irá aparecer e a coluna que iremos classificar em ordem 
decrescente é a dos Alunos, porque será mais prático para visualizar qual o curso 
que tem mais alunos. 


FIGURA 7 - FORMATAÇÃO DO EXCEL - CLASSIFICAÇÃO 
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FIGURA 8 — FORMATAÇÃO DO EXCEL — CLASSIFICAÇÃO 


FONTE: Os autores 


É possível escolher vários tipos de gráficos, dependendo do que está 
sendo representado na planilha de dados. Como os nomes dos cursos ocupam um 
espaço grande no eixo de x, este gráfico ficará esteticamente mais apresentável se 
for feito em forma de barras. Para tanto, selecione a guia “Inserir” e escolha a 
opção “Barras”. 


FIGURA 9 - FORMATAÇÃO DO EXCEL — SELEÇÃO DO TIPO DE GRÁFICO 


-e — ; == 


| Inserir | Layout da Página Fórmulas Dados Revisão Exibição 


|] a HOR NOTA O 
a Imagem Clip-art Formas SmartArt Colunas Linhas Pizza Barras Área Dispersão sea i 
Ilustrações Gráficos fa 


FONTE: Os autores 


O resultado será o gráfico que já apresentamos no início deste apêndice. 


O mesmo gráfico poderá ainda receber outras cores, padrões e fontes, 
obtendo assim características personalizadas de acordo com o gosto de quem o 
está construindo. Para isto basta clicar sobre a região que se quer alterar e, ao 
abrir a janela correspondente, efetuar os comandos, de acordo com as alterações 
que se queiram realizar. Se quisermos, por exemplo, dar outras cores às colunas, 
basta clicar com o botão direito do mouse, diretamente sobre uma coluna. Abrir- 
se-á uma janela com todas as possíveis ações a serem realizadas. 
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Um tipo de gráfico também bastante utilizado é o gráfico de setores, 
ou de pizza. Normalmente usa-se este tipo de gráfico quando se quer trabalhar 
com percentuais. O procedimento para sua construção também é o mesmo dos 
gráficos anteriores. Basta selecionar as colunas referentes ao gráfico e selecionar 
“Pizza” na guia “Inserir”: 


GRÁFICO 14 - FORMATAÇÃO DO EXCEL - SELEÇÃO DO TIPO DE GRÁFICO - PIZZA 
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Se quisermos os percentuais de alunos de cada curso, é possível colocá- 
los em cada “fatia da pizza”. Para isso, coloca-se o cursor sobre uma das fatias e 
clica-se com o lado direito do mouse. Em seguida clicar sobre “Formatar adicionar 
rótulos de dados”. 
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FIGURA 10 - FORMATAÇÃO DO EXCEL - SELEÇÃO DA PORCENTAGEM 
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Ao abrir a janela, clicar em “Opções de Rótulo” e em seguida marcar 
“Porcentagem”. 


FIGURA 11 - FORMATAÇÃO DO EXCEL - SELEÇÃO DA PORCENTAGEM 
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Ao dar “Fechar”, os percentuais aparecerão sobre cada fatia da pizza, 
conforme mostramos no gráfico a seguir: 


GRÁFICO 15 — FORMATAÇÃO DO EXCEL — SELEÇÃO DA PORCENTAGEM - PIZZA 
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Obs.: Os procedimentos descritos servem, basicamente, para a construção de 
qualquer tipo de gráfico. 


3 GRÁFICO DE DISPERSÃO 


Umoutrotipode gráficoéodadispersão, quenos possibilita fazer acorrelação 
entre duas colunas de dados e determinar a função estimada, possibilitando assim 
fazer estimativas, dependendo do tipo de dados de que dispomos. 


Podemos verificar se existe correlação entre masculino e feminino 
em nossa tabela de dados. Iniciamos, selecionando as duas colunas de dados 
correspondentes a masculino e feminino. Depois vamos para a guia “Inserir” e 
selecionamos “Dispersão”. 
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FIGURA 12 — FORMATAÇÃO DO EXCEL - SELEÇÃO DO TIPO DE GRÁFICO 


FONTE: Os autores 


Aparecerá o gráfico: 


GRÁFICO 16- FORMATAÇÃO DO EXCEL - CONSTRUÇÃO DO GRÁFICO 
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Percebemos que os dados estão bastante dispersos e que não há uma boa 
correlação entre eles. Podemos melhorar um pouco a apresentação do gráfico. 
Para isso, selecione o gráfico, vá para a guia “Design” e em “Layout do Gráfico” 
selecione o “Layout 1”. 


FIGURA 13 — FORMATAÇÃO DO EXCEL - CONSTRUÇÃO DO GRÁFICO 


FONTE: Os autores 
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Então o gráfico aparecerá da seguinte forma: 


GRÁFICO 17 — FORMATAÇÃO DO EXCEL - CONSTRUÇÃO DO GRÁFICO 
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Então, agora nós poderemos tirar a legenda, para isso basta selecionar a 
legenda e deletar (apertar a tecla “Del” ou “Delete” no teclado). Agora precisamos 
renomear os títulos dos eixos e o título do gráfico. No nosso caso, o título do 
gráfico será Matrículas, o eixo x será Masculino e o eixo y será Feminino. Para isso 
basta selecionar, no próprio gráfico, os títulos e renomeá-los. 


GRÁFICO 18 — FORMATAÇÃO DO EXCEL — GRÁFICO DE DISPERSÃO 
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4 LINHA DE TENDÊNCIA E FUNÇÃO 


Agora é possível verificar a correlação existente entre os pontos e a função 
matemática formada por eles. Inicialmente é preciso clicar sobre qualquer um dos 
pontos do gráfico com o botão direito do mouse. Abrir-se-á uma janelinha onde 
selecionaremos “Adicionar linha de tendência”. 


FIGURA 14 - FORMATAÇÃO DO EXCEL — LINHA DE TENDÊNCIA 
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Após clicarmos em “Adicionar linha de tendência...” abrirá uma nova 
janela. Nessa temos que selecionar no “Tipo de Tendência/Regressão” a opção 
“Linear”, mais as opções “Exibir Equação no Gráfico” e “Exibir valor de 

P 
R-quadrado no gráfico”. 
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FIGURA 15 — FORMATAÇÃO DO EXCEL - SELEÇÃO DO TIPO DE DISPERSÃO 
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Teremos no gráfico a reta que mais se ajusta a estas duas grandezas de 
dados, a respectiva função da reta e a correlação. 


GRÁFICO 19 — FORMATAÇÃO DO EXCEL — SELEÇÃO DO TIPO DE DISPERSÃO 
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Constatamos que estes dados não possuem uma boa correlação entre si, 
já que o R? = 0,1126. Tirando a raiz quadrada deste valor, temos apenas 33,5% de 
correlação entre os dados. 
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A partir da função do gráfico é possível fazer todo tipo de estimativas. 
Para isto basta atribuir um valor a x, dentro da função e obteremos o valor de 
y, ou vice-versa. Por exemplo: qual é a estimativa de alunas num curso com 50 
alunos do sexo masculino? 


Calculando: na função do gráfico, 'x' representa o sexo masculino e 'y' o 
sexo feminino. Logo, substituindo 50 no lugar do x da função, teremos: y = 0,2725 
* 50 + 131,78. Isto nos dará uma estimativa de 145 mulheres. 


Além da construção de tabelas e gráficos no Excel, também é possível 
determinar todas as medidas de tendência central e de dispersão, para dados não 
agrupados. 


Assim, terminada a formatação dos dados em planilhas, vamos aos 
cálculos estatísticos. 


O primeiro passo, já com a tabela pronta, é como fazer o somatório 
dos valores. Seleciona-se a coluna que se quer somar e em seguida na barra de 
ferramentas, clica-se no ícone da “Autossoma” (Ł). E assim sucessivamente até 
completar o somatório de todas as colunas. 


Geralmente o Excel não está com a ferramenta estatística habilitada. Para 


habilitá-la, temos que clicar na setinha que aparece no canto superior direito da 
tela e, em seguida, em “Mais comandos”: 


FIGURA 16 — FORMATAÇÃO DO EXCEL — CÁLCULOS DE ESTATÍSTICA DESCRITIVA 
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Uma nova janela abrirá, nessa você vai em “Suplementos”, seleciona 
“Ferramentas de Análise” e clique em “Ir”. 
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FIGURA 17 - FORMATAÇÃO DO EXCEL - CÁLCULOS DE ESTATÍSTICA DESCRITIVA 
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Vai aparecer a tela que mostramos em seguida. Selecione os itens que 
aparecem na figura e dê um “OK”. 


FIGURA 18 - FORMATAÇÃO DO EXCEL - CÁLCULOS DE 
ESTATÍSTICA DESCRITIVA 
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Ao fazer isso a ferramenta “Estatística” estará habilitada. Para selecionar 
a opção, vá para a guia “Dados” e selecione “Análise de Dados”. 


179 


APÊNDICE A 


FIGURA 19 - FORMATAÇÃO DO EXCEL - CÁLCULOS DE ESTATÍSTICA DESCRITIVA 


q 
Y Tetopse Remover Validação Conichigar Testede Agrapar Desagrupir Subtotal 
a nè AP Annado | estonar Oguni Soso Hipóteses = 


B.e 
es A | E ES RE Se BD A ds o 
Z) Clsutcar Fatro 


FONTE: Os autores 


FIGURA 20 - FORMATAÇÃO DO EXCEL - CÁLCULOS DE ESTATÍSTICA DESCRITIVA 
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Supondo que se queira fazer a estatística descritiva da coluna “Alunos” da 
nossa tabela, na janela aberta, é necessário introduzir esta informação no intervalo 
de entrada. Para isto, com o cursor piscando no intervalo de entrada, seleciona- 


se toda a coluna “Alunos”. Imediatamente aparecerão no intervalo de entrada os 
valores referentes ao intervalo selecionado. 


FIGURA 21 - FORMATAÇÃO DO EXCEL - SELEÇÃO DO INTERVALO DE DADOS 
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Agora é necessário demarcar o intervalo de saída. Fazendo a seleção do 
intervalo de saída, e com o cursor do mouse piscando no intervalo, selecione qualquer 
célula vazia da planilha do Excel, onde se quer que o resultado seja inserido. Antes 
de dar “Ok”, é preciso selecionar também o comando “Resumo estatístico”. 


FIGURA 22 — FORMATAÇÃO DO EXCEL — RESUMO ESTATÍSTICO 
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Ao fazer isso aparecerá no local selecionado o resumo estatístico referente 
à coluna “Alunos”. 


O mesmo procedimento poderá ser feito com qualquer coluna da planilha. 


Em frações de segundos é possível ter na tela: média, mediana, moda, desvio 
padrão, variância, assimetria e outros dados estatísticos. 


FIGURA 23 — FORMATAÇÃO DO EXCEL — RESULTADOS ESTATÍSTICOS 


FONTE: Os autores 


181 


Na figura anterior encontram-se todos os cálculos da estatística descritiva 
conforme estudos realizados no decorrer deste Caderno de Estudos. 


LEITURA COMPLEMENTAR 


ENTENDENDO A IMPORTÂNCIA DA ESTATÍSTICA SEM SER GÊNIO, 
MATEMATICO OU BRUXO 
Paulo Afonso Lopes 


Jornais, televisão, rádio, revistas e outros meios de comunicação nos 
bombardeiam, diariamente, com notícias baseadas em estatísticas como se fossem 
verdades absolutas. Nessa hora, provavelmente, você sente a importância de ser 
capaz de avaliar corretamente o que lhe dizem. Todavia, será que os números 
apresentados resultam de uma análise estatística cuidadosa? O perigo está no 
fato de que, se não consegue distinguir as afirmações falsas das verdadeiras, então 
você está vulnerável à manipulação por outras pessoas, cujas conclusões podem 
conduzir você para decidir contra os interesses seus e, depois, arrepender-se. Por 
estas razões, conhecer Estatística é um grande passo no sentido de você tomar 
controle da sua vida (embora não seja, obviamente, a única maneira necessária 
para esta finalidade). 


Observe os seguintes exemplos de afirmações recentemente publicadas 
em dez meios de comunicação (não estou dizendo que cada uma delas seja 
verdadeira): 


* Sua expectativa é de que a inflação feche o ano entre 6% e 7%. (Folha de 
São Paulo, Dinheiro, 16 de maio de 2005). 


* Atualmente, a taxa de pacientes com câncer de pulmão quenão apresentam 
reincidência depois de cinco anos de tratamento é de 17% — um avanço de 70% em 
relação à década de 70. (Revista Veja, edição 1905, 18 de maio de 2005). 


* As projeções de mercado para o IPCA de 2005 subiram de 6,30% para 
6,39% em pesquisa semanal feita pelo Banco Central e divulgada hoje. (O Estado 
de São Paulo, 16 de maio de 2005). 


* Um estudo da Corporate Executive Board mostrou que a produtividade de 
um funcionário brilhante chega a ser até 12 vezes superior à do colega mediano. 
(Revista Exame, edição 841, 27 de abril de 2005). 


* De acordo com a Embratur (Empresa Brasileira de Turismo), a companhia 
aérea trouxe 1.473.183 dos 6.138.000 passageiros que entraram no país no ano 
passado, o equivalente a 24% desses passageiros. (Revista Aeromagazine, 
Notícias, 16 de maio de 2005). 


* IBGE: Emprego industrial cai 0,2% em março (JB On-line, 16 de maio 
de 2005). 


* Os investidores que colocam todo seu dinheiro em uma única ação 
estão elevando em mais de 50% a chance de queda do poder de compra de seu 
investimento em um período de 20 anos, aponta o estudo. (JB On-line, 17 de abril 
de 2005). 


* Nordestinos já são 52,6% dos migrantes (Jornal O Globo, 16 de maio 
de 2005). 


* Comércio varejista cresce 1,75% em volume de vendas e 2,44% em receita 
nominal (IBGE, 12 de maio de 2005). 


* Se a vítima não fosse o prefeito de Santo André, o impacto não seria o 
mesmo e o caso teria sido tratado como mera estatística. (Márcio Coimbra em 
http://www .ambito-juridico.com.br/aj/cron0237.htm). 


Todas essas notícias são, na sua essência, Estatística. Elas parecem 
familiares, embora os exemplos sejam de áreas bastante distintas: economia, 
medicina, gestão, turismo, social, investimentos, comércio e até política. Em 
resumo, os números (também expressos por meio de tabelas e gráficos) e a 
interpretação deles surgem nos discursos de praticamente todo aspecto da vida 
contemporânea. 


Desse modo, as estatísticas são, frequentemente, apresentadas como um 
testemunho de credibilidade a um argumento ou a uma recomendação, fato que 
você pode comprovar ouvindo o veiculado nos meios de comunicação: o primeiro 
pensamento é acreditar na notícia como se fosse verdade absoluta. Recorde-se, 
então, do ex-primeiro-ministro britânico, Benjamin Disraeli (1804-1881), quando 
afirmou que “Há três espécies de mentiras: mentiras, mentiras deslavadas e 
estatísticas”. 


No entanto, Estatística é método, ciência e arte. É método quando, na Física, 
na Biologia, na Medicina ou na Pedagogia aplica-se a populações específicas, isto 
é, serve a uma ciência particular, da qual se torna instrumento. É ciência quando, 
graças às suas teorias, estuda grandes conjuntos, independentemente da natureza 
destes, sendo autônoma e universal. Finalmente, é arte na construção de modelos 
para representar a realidade. 


Assim sendo, nem tudo está perdido, porque a Estatística pode ajudar 
você a reagir de modo inteligente às informações que lê ou escuta e, neste sentido, 
torna-se um dos mais importantes assuntos que provavelmente estudou. 


O presente artigo tem o objetivo de motivar você a ser mais um dos 
consumidores inteligentes de estatísticas e, para ser um deles, o primeiro passo 
é refletir e começar a questionar aquelas que encontrar. Por esta razão, convido 


você a reformar os seus hábitos estatísticos a partir de agora. Simplesmente, não 
mais aceite números, tabelas, gráficos e conclusões. Ao invés disso, comece a 
pensar nas fontes de informação e, mais importante, nos procedimentos usados 
para gerar essa informação. Defenda-se contra afirmações falsas, embrulhadas 
como se fossem estatísticas. Aprenda a reconhecer se uma evidência estatística 
apoia, realmente, uma conclusão apresentada. 


A Estatística está toda ela em volta de você, algumas vezes usada de 
modo adequado, outras vezes não. Como o objetivo da Estatística é auxiliar a 
sua tomada de decisões em situações de incerteza, distinguir as boas das más 
estatísticas é, mais do que nunca, um dever, uma obrigação. 


FONTE: LOPES, Paulo Afonso. Entendendo a importância da estatística sem ser gênio, 
matemático ou bruxo. Disponível em: <http:/Awww.sindhosp.com.br/IMP. 291D.htm>. Acesso 
em: 24 nov. 2006. 


RESUMO DO APÊNDICE A 


Neste tópico você estudou: 


e Como desenvolver a estatística apresentada no decorrer deste caderno, fazendo 
uso de uma planilha eletrônica do Excel. 
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AUTOATIVIDADE 


1 Construa, a partir da tabela seguinte, um gráfico de linhas para indicar o 
número de passagens aéreas vendidas neste período e, em seguida, faça o 
gráfico de dispersão, indicando o grau de correlação e a função de regressão, 
a fim de que se possa estimar a venda de passagens para 2007. 


TABELA 58 — PASSAGENS VENDIDAS - PERÍODO DE 1995-2001 


ANO PASSAGENS 
1995 13380 
1996 13674 
1997 14692 
1998 14898 
1999 15255 
2000 15990 
2001 16742 


FONTE: Dados fictícios 
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